О web-разработке
и даже немного больше...

Транслитерация символов на PHP

transliteraciyaТранслитерация сегодня применяется довольно обширно, в различных приложениях и не только. Кто не слышал о том, что такое транслитерация, немного поясню. Чтобы перевести знаки одной письменности в знаки другой удобно использовать транслитерацию. При этом каждый знак, либо последовательность знаков одной системы письма передается одним и тем же знаком или последовательностью другой системы письма. Данную систему можно было наблюдать ещё в момент появления мобильной связи, к примеру, когда вы пишите SMS сообщение на русском языке, а адресату приходит сообщение уже с транслитерацией, с буквами английского алфавита.

В сети интернет транслитерация также используется довольно часто, как правило, там, где есть необходимость конвертации символов русского языка на английский. Одним из ярких примеров является ЧПУ, в них традиционно содержаться закладываются названия страниц, а так же отсекаются все лишние символы. Такая реализация URL адресов может положительно повлиять на продвижение страниц сайта в поисковых системах.

Рассмотрим довольно простой пример, который демонстрирует транслитерацию текста с русского на английский язык.

// функция транслитерации символов
function translit($str){
$str = strtr(
		$str,
		"абвгдежзийклмнопрстуфыэАБВГДЕЖЗИЙКЛМНОПРСТУФЫЭ",
		"abvgdegziyklmnoprstufieABVGDEGZIYKLMNOPRSTUFIE"
	);
$str = strtr($str, array(
		'ё'=>"yo",'х'=>"h",'ц'=>"ts",
		'ч'=>"ch",'ш'=>"sh",'щ'=>"shch",
		'ъ'=>'','ь'=>'','ю'=>"yu",
		'я'=>"ya",'Ё'=>"Yo",'Х'=>"H",
		'Ц'=>"Ts",'Ч'=>"Ch",'Ш'=>"Sh",
		'Щ'=>"Shch",'Ъ'=>'','Ь'=>'',
		'Ю'=>"Yu",'Я'=>"Ya",
	)
);
	return $str;
}

echo translit("Здесь будет строка для транслитерации.");
// получаем: Zdes budet stroka dlya transliteratsii.

В данном примере, ключевым моментом является использование штатной функции PHP strtr, с посредством которой производится замена символов, а так же комбинаций символов. Более подробно возможность данной функции документирована в документации PHP, и при необходимости вы можете с ней разобраться более детально.
В примере выше строка транслитерируется таким образом, что для использования в URL лучше не оставлять символов пробела, а заменять знаком тире, либо нижним подчеркиванием. Исправим ситуацию, рассмотрим второй пример, который транслитерирует строку, таким образом, который необходим для использования в URL.

function translit($string){
    $converter = array(
        'а' => 'a',   'б' => 'b',   'в' => 'v',
        'г' => 'g',   'д' => 'd',   'е' => 'e',
        'ё' => 'e',   'ж' => 'zh',  'з' => 'z',
        'и' => 'i',   'й' => 'y',   'к' => 'k',
        'л' => 'l',   'м' => 'm',   'н' => 'n',
        'о' => 'o',   'п' => 'p',   'р' => 'r',
        'с' => 's',   'т' => 't',   'у' => 'u',
        'ф' => 'f',   'х' => 'h',   'ц' => 'c',
        'ч' => 'ch',  'ш' => 'sh',  'щ' => 'sch',
        'ь' => '\'',  'ы' => 'y',   'ъ' => '\'',
        'э' => 'e',   'ю' => 'yu',  'я' => 'ya',
        
        'А' => 'A',   'Б' => 'B',   'В' => 'V',
        'Г' => 'G',   'Д' => 'D',   'Е' => 'E',
        'Ё' => 'E',   'Ж' => 'Zh',  'З' => 'Z',
        'И' => 'I',   'Й' => 'Y',   'К' => 'K',
        'Л' => 'L',   'М' => 'M',   'Н' => 'N',
        'О' => 'O',   'П' => 'P',   'Р' => 'R',
        'С' => 'S',   'Т' => 'T',   'У' => 'U',
        'Ф' => 'F',   'Х' => 'H',   'Ц' => 'C',
        'Ч' => 'Ch',  'Ш' => 'Sh',  'Щ' => 'Sch',
        'Ь' => '\'',  'Ы' => 'Y',   'Ъ' => '\'',
        'Э' => 'E',   'Ю' => 'Yu',  'Я' => 'Ya',
    );
    return strtr($string, $converter);
}

function makeUrlCode($str){
	return trim(preg_replace('~[^-a-z0-9_]+~u', '-', strtolower(translit($str))), "-");
}

echo makeUrlCode("Здесь название вашей страницы!");
// вывод: zdes-nazvanie-vashey-stranicy

В данном примере реализованы две функции: translit и makeUrlCode. Функция translit производит транслитерацию строки, вторая функция makeUrlCode получая в качестве параметров строку, передает её функции translit, затем переводит результат в строку нижнего регистра, а так же удаляет/заменяет все ненужные символы. В итоге на выходе получается код, пригодный для использования его в URL.

Опубликован: 24.11.2015 г.

См. также:

Редакторы кода для PHP
Как просмотреть время загрузки страницы в PHP?
Генерация QR-кода в PHP
Загрузка файлов на сервер посредством Ajax
Импорт записей из Excel в WordPress
Парсинг XML в PHP
Установка IonCube на XAMPP
Создание PDF файлов в PHP

Комментарии

  1. Yuklov пишет:

    У меня есть вордпресс плагин-транслитератор, который работает с функцией $replace = array и return strtr($text,self::$replace). Не могу добавлят эти функции:
    1. Как делать чтобы в начале слова (или строки) букву «Е» транслитерировать как «Ye», в остальных случаях «E»?
    2. Если все буквы слова вверхном регистре, Ш должен транслитерировать как SH, а не Sh.

    Если кто-нибудь знает, помогите пожалуйста.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Комментарии
  • Загрузка...
Друзья сайта