Транслитерация сегодня применяется довольно обширно, в различных приложениях и не только. Кто не слышал о том, что такое транслитерация, немного поясню. Чтобы перевести знаки одной письменности в знаки другой удобно использовать транслитерацию. При этом каждый знак, либо последовательность знаков одной системы письма передается одним и тем же знаком или последовательностью другой системы письма. Данную систему можно было наблюдать ещё в момент появления мобильной связи, к примеру, когда вы пишите SMS сообщение на русском языке, а адресату приходит сообщение уже с транслитерацией, с буквами английского алфавита.
В сети интернет транслитерация также используется довольно часто, как правило, там, где есть необходимость конвертации символов русского языка на английский. Одним из ярких примеров является ЧПУ, в них традиционно содержаться закладываются названия страниц, а так же отсекаются все лишние символы. Такая реализация URL адресов может положительно повлиять на продвижение страниц сайта в поисковых системах.
Рассмотрим довольно простой пример, который демонстрирует транслитерацию текста с русского на английский язык.
// функция транслитерации символов function translit($str){ $str = strtr( $str, "абвгдежзийклмнопрстуфыэАБВГДЕЖЗИЙКЛМНОПРСТУФЫЭ", "abvgdegziyklmnoprstufieABVGDEGZIYKLMNOPRSTUFIE" ); $str = strtr($str, array( 'ё'=>"yo",'х'=>"h",'ц'=>"ts", 'ч'=>"ch",'ш'=>"sh",'щ'=>"shch", 'ъ'=>'','ь'=>'','ю'=>"yu", 'я'=>"ya",'Ё'=>"Yo",'Х'=>"H", 'Ц'=>"Ts",'Ч'=>"Ch",'Ш'=>"Sh", 'Щ'=>"Shch",'Ъ'=>'','Ь'=>'', 'Ю'=>"Yu",'Я'=>"Ya", ) ); return $str; } echo translit("Здесь будет строка для транслитерации."); // получаем: Zdes budet stroka dlya transliteratsii.
В данном примере, ключевым моментом является использование штатной функции PHP strtr, с посредством которой производится замена символов, а так же комбинаций символов. Более подробно возможность данной функции документирована в документации PHP, и при необходимости вы можете с ней разобраться более детально.
В примере выше строка транслитерируется таким образом, что для использования в URL лучше не оставлять символов пробела, а заменять знаком тире, либо нижним подчеркиванием. Исправим ситуацию, рассмотрим второй пример, который транслитерирует строку, таким образом, который необходим для использования в URL.
function translit($string){ $converter = array( 'а' => 'a', 'б' => 'b', 'в' => 'v', 'г' => 'g', 'д' => 'd', 'е' => 'e', 'ё' => 'e', 'ж' => 'zh', 'з' => 'z', 'и' => 'i', 'й' => 'y', 'к' => 'k', 'л' => 'l', 'м' => 'm', 'н' => 'n', 'о' => 'o', 'п' => 'p', 'р' => 'r', 'с' => 's', 'т' => 't', 'у' => 'u', 'ф' => 'f', 'х' => 'h', 'ц' => 'c', 'ч' => 'ch', 'ш' => 'sh', 'щ' => 'sch', 'ь' => '\'', 'ы' => 'y', 'ъ' => '\'', 'э' => 'e', 'ю' => 'yu', 'я' => 'ya', 'А' => 'A', 'Б' => 'B', 'В' => 'V', 'Г' => 'G', 'Д' => 'D', 'Е' => 'E', 'Ё' => 'E', 'Ж' => 'Zh', 'З' => 'Z', 'И' => 'I', 'Й' => 'Y', 'К' => 'K', 'Л' => 'L', 'М' => 'M', 'Н' => 'N', 'О' => 'O', 'П' => 'P', 'Р' => 'R', 'С' => 'S', 'Т' => 'T', 'У' => 'U', 'Ф' => 'F', 'Х' => 'H', 'Ц' => 'C', 'Ч' => 'Ch', 'Ш' => 'Sh', 'Щ' => 'Sch', 'Ь' => '\'', 'Ы' => 'Y', 'Ъ' => '\'', 'Э' => 'E', 'Ю' => 'Yu', 'Я' => 'Ya', ); return strtr($string, $converter); } function makeUrlCode($str){ return trim(preg_replace('~[^-a-z0-9_]+~u', '-', strtolower(translit($str))), "-"); } echo makeUrlCode("Здесь название вашей страницы!"); // вывод: zdes-nazvanie-vashey-stranicy
В данном примере реализованы две функции: translit и makeUrlCode. Функция translit производит транслитерацию строки, вторая функция makeUrlCode получая в качестве параметров строку, передает её функции translit, затем переводит результат в строку нижнего регистра, а так же удаляет/заменяет все ненужные символы. В итоге на выходе получается код, пригодный для использования его в URL.
У меня есть вордпресс плагин-транслитератор, который работает с функцией $replace = array и return strtr($text,self::$replace). Не могу добавлят эти функции:
1. Как делать чтобы в начале слова (или строки) букву «Е» транслитерировать как «Ye», в остальных случаях «E»?
2. Если все буквы слова вверхном регистре, Ш должен транслитерировать как SH, а не Sh.
Если кто-нибудь знает, помогите пожалуйста.