Транслитерация сегодня применяется довольно обширно, в различных приложениях и не только. Кто не слышал о том, что такое транслитерация, немного поясню. Чтобы перевести знаки одной письменности в знаки другой удобно использовать транслитерацию. При этом каждый знак, либо последовательность знаков одной системы письма передается одним и тем же знаком или последовательностью другой системы письма. Данную систему можно было наблюдать ещё в момент появления мобильной связи, к примеру, когда вы пишите SMS сообщение на русском языке, а адресату приходит сообщение уже с транслитерацией, с буквами английского алфавита.
В сети интернет транслитерация также используется довольно часто, как правило, там, где есть необходимость конвертации символов русского языка на английский. Одним из ярких примеров является ЧПУ, в них традиционно содержаться закладываются названия страниц, а так же отсекаются все лишние символы. Такая реализация URL адресов может положительно повлиять на продвижение страниц сайта в поисковых системах.
Рассмотрим довольно простой пример, который демонстрирует транслитерацию текста с русского на английский язык.
// функция транслитерации символов
function translit($str){
$str = strtr(
$str,
"абвгдежзийклмнопрстуфыэАБВГДЕЖЗИЙКЛМНОПРСТУФЫЭ",
"abvgdegziyklmnoprstufieABVGDEGZIYKLMNOPRSTUFIE"
);
$str = strtr($str, array(
'ё'=>"yo",'х'=>"h",'ц'=>"ts",
'ч'=>"ch",'ш'=>"sh",'щ'=>"shch",
'ъ'=>'','ь'=>'','ю'=>"yu",
'я'=>"ya",'Ё'=>"Yo",'Х'=>"H",
'Ц'=>"Ts",'Ч'=>"Ch",'Ш'=>"Sh",
'Щ'=>"Shch",'Ъ'=>'','Ь'=>'',
'Ю'=>"Yu",'Я'=>"Ya",
)
);
return $str;
}
echo translit("Здесь будет строка для транслитерации.");
// получаем: Zdes budet stroka dlya transliteratsii.
В данном примере, ключевым моментом является использование штатной функции PHP strtr, с посредством которой производится замена символов, а так же комбинаций символов. Более подробно возможность данной функции документирована в документации PHP, и при необходимости вы можете с ней разобраться более детально.
В примере выше строка транслитерируется таким образом, что для использования в URL лучше не оставлять символов пробела, а заменять знаком тире, либо нижним подчеркиванием. Исправим ситуацию, рассмотрим второй пример, который транслитерирует строку, таким образом, который необходим для использования в URL.
function translit($string){
$converter = array(
'а' => 'a', 'б' => 'b', 'в' => 'v',
'г' => 'g', 'д' => 'd', 'е' => 'e',
'ё' => 'e', 'ж' => 'zh', 'з' => 'z',
'и' => 'i', 'й' => 'y', 'к' => 'k',
'л' => 'l', 'м' => 'm', 'н' => 'n',
'о' => 'o', 'п' => 'p', 'р' => 'r',
'с' => 's', 'т' => 't', 'у' => 'u',
'ф' => 'f', 'х' => 'h', 'ц' => 'c',
'ч' => 'ch', 'ш' => 'sh', 'щ' => 'sch',
'ь' => '\'', 'ы' => 'y', 'ъ' => '\'',
'э' => 'e', 'ю' => 'yu', 'я' => 'ya',
'А' => 'A', 'Б' => 'B', 'В' => 'V',
'Г' => 'G', 'Д' => 'D', 'Е' => 'E',
'Ё' => 'E', 'Ж' => 'Zh', 'З' => 'Z',
'И' => 'I', 'Й' => 'Y', 'К' => 'K',
'Л' => 'L', 'М' => 'M', 'Н' => 'N',
'О' => 'O', 'П' => 'P', 'Р' => 'R',
'С' => 'S', 'Т' => 'T', 'У' => 'U',
'Ф' => 'F', 'Х' => 'H', 'Ц' => 'C',
'Ч' => 'Ch', 'Ш' => 'Sh', 'Щ' => 'Sch',
'Ь' => '\'', 'Ы' => 'Y', 'Ъ' => '\'',
'Э' => 'E', 'Ю' => 'Yu', 'Я' => 'Ya',
);
return strtr($string, $converter);
}
function makeUrlCode($str){
return trim(preg_replace('~[^-a-z0-9_]+~u', '-', strtolower(translit($str))), "-");
}
echo makeUrlCode("Здесь название вашей страницы!");
// вывод: zdes-nazvanie-vashey-stranicy
В данном примере реализованы две функции: translit и makeUrlCode. Функция translit производит транслитерацию строки, вторая функция makeUrlCode получая в качестве параметров строку, передает её функции translit, затем переводит результат в строку нижнего регистра, а так же удаляет/заменяет все ненужные символы. В итоге на выходе получается код, пригодный для использования его в URL.
У меня есть вордпресс плагин-транслитератор, который работает с функцией $replace = array и return strtr($text,self::$replace). Не могу добавлят эти функции:
1. Как делать чтобы в начале слова (или строки) букву «Е» транслитерировать как «Ye», в остальных случаях «E»?
2. Если все буквы слова вверхном регистре, Ш должен транслитерировать как SH, а не Sh.
Если кто-нибудь знает, помогите пожалуйста.