Строки
Управляющие последовательности
Если строка заключена в двойные кавычки ("), PHP распознает большее количество управляющих последовательностей для специальных символов:
Последовательность | Значение |
---|---|
\n | новая строка (LF или 0x0A (10) в ASCII) |
\r | возврат каретки (CR или 0x0D (13) в ASCII) |
\t | горизонтальная табуляция (HT или 0x09 (9) в ASCII) |
\v | вертикальная табуляция (VT или 0x0B (11) в ASCII) (с версии PHP 5.2.5) |
\e | escape-знак (ESC или 0x1B (27) в ASCII) (с версии PHP 5.4.4) |
\f | подача страницы (FF или 0x0C (12) в ASCII) (с версии PHP 5.2.5) |
\\ | обратная косая черта |
\$ | знак доллара |
\" | двойная кавычка |
\[0-7]{1,3} | последовательность символов, соответствующая регулярному выражению символа в восьмеричной системе счисления |
\x[0-9A-Fa-f]{1,2} | последовательность символов, соответствующая регулярному выражению символа в шестнадцатеричной системе счисления |
Манипулирование строками
Для работы со строками в PHP существует целый ряд специализированных функций.
Форматирование строк
В PHP есть две функции, позволяющие отформатировать данные перед выводом:
- printf() - выводит отформатированную строку в окно браузера;
- sprintf() - выводит отформатированную строку в переменную.
Далее можно использовать для записи в файл с помощью функции fputs().
Этим функциям передаются строка управления форматом и сами форматируемые данные. Строка управления форматом включает в себя обычные символы, которые прямо копируются в результат, и определители преобразования. Каждый определитель преобразования начинается с символа процента (%) и включает следующие элементы:
- указатель заполнения используется, если необходимо увеличить размер строки. По умолчанию выполняется заполнение пробелами. Можно указать и 0. Перед любым другим символом заполнения надо поставить одинарную кавычку ('). Необязательный параметр;
- указатель выравнивания, заданный знаком минус (-), определяет выравнивание влево. По умолчанию выполняется выравнивание вправо. Необязательный параметр;
- указатель ширины задает количество символов, которое должно содержаться в выводимых данных. Необязательный параметр;
- указатель точности задает количество десятичных знаков, отображаемых для чисел с плавающей запятой. Необязательный параметр;
- указатель типа задает тип, в соответствии с которым следует
обрабатывать выводимые данные. Возможные значения:
d десятичное число b двоичное число c ASCII-эквивалент f число с плавающей точкой двойной точности o восьмеричное число s строка x шестнадцатеричное число в нижнем регистре X шестнадцатеричное число в верхнем регистре
Пример 1
<html> <head> <title>Форматирование вывода в окно браузера</title> </head> <body> <?php $товары = array ("помидоры" => 15, "огурцы" => 12, "картофель" => 10); echo "<pre>"; printf ("%-25s%25s\n%'=50s\n", "Наименование", "Цена", ""); foreach ($товары as $наим => $цена) printf ("%'.-25s%'.22.2f\n", $наим, $цена); echo "</pre>"; ?> </body> </html>
Анализ строк
PHP содержит множество функций, дающих информацию о строках. Наиболее употребимыми являются:
- strlen() - определяет длину строки.
- strstr() - определяет наличие подстроки в строке. Аргументы:
исходная строка и искомая подстрока. Если такой подстроки в строке нет, функция
возвращает false. Если подстрока в строке есть, функция
возвращает часть исходной строки, которая начинается с искомой подстроки.
echo strstr ("Кто там?", "там"); // выводит "там?"
- stristr() - работает так же, как и strstr(), но не различает регистры.
- strpos() - определяет позицию подстроки в строке. Аргументы:
исходная строка и искомая подстрока. Если такой подстроки в строке нет, функция
возвращает false. Если подстрока в строке есть, функция
возвращает номер символа, с которого начинается подстрока.
echo strpos ("Кто там?", "там"); // выводит "4"
- substr() - возвращает часть строки, ограниченную параметрами.
Аргументы: исходная строка, начальная позиция, длина подстроки (необязательно).
Если начальная позиция отрицательна, то отсчет идет от конца строки.
Если длина не указана, возвращается остаток строки.
Если длина отрицательна, то подстрока завершается на указанной
позиции от конца строки.
echo substr ("раз-два-три", 4, 3); // выводит "два" echo substr ("раз-два-три", 4); // выводит "два-три" echo substr ("раз-два-три", -3, 3); // выводит "три" echo substr ("раз-два-три", 4, -3); // выводит "два-"
Управление строками
PHP содержит множество функций управления строками. Наиболее употребимыми являются:
- ltrim(), chop(), trim() - удаляют все разделители соответственно в начале строки, в конце строки, в начале и конце строки. К разделителям относятся следующие символы: "\n" (новая строка), "\r" (возврат каретки), "\t" (табуляция), простой пробел.
- str_replace() - заменяет все экземпляры указанной подстроки в
строке на новую подстроку. Аргументы: заменяемая подстрока, замещающая
подстрока, исходная строка. Например:
echo str_replace ("там", "тут", "Кто там?"); // выводит "Кто тут?"
- substr_replace() - заменяет часть строки, ограниченную параметрами.
Аргументы: исходная строка, замещающая подстрока, начальная позиция, длина
заменяемой подстроки (необязательно). Если начальная позиция отрицательна, то
отсчет идет от конца строки. Если длина не указана, используется вся длина
строки. Если длина отрицательна, то замена завершается на указанной
позиции от конца строки. Например:
echo substr_replace ("раз-два-три", "пять", 4, 3); // выводит "раз-пять-три" echo substr_replace ("раз-два-три", "пять", 4); // выводит "раз-пять" echo substr_replace ("раз-два-три", "пять", -3, 3); // выводит "раз-два-пять" echo substr_replace ("раз-два-три", "пять", 4, -3); // выводит "раз-пятьтри"
- strtoupper() - переводит символы строки в верхний регистр.
- strtolower() - переводит символы строки в нижний регистр.
- ucwords() - переводит в верхний регистр первый символ каждого слова.
- explode() - разбивает строку на массив.
Аргументы: строка-разделитель и исходная строка. Например:
$строка = "Голова моя машет ушами"; $массив = explode(" ",$str); // count ($массив) == 4 // $массив[0] == "Голова" // $массив[1] == "моя" // $массив[2] == "машет" // $массив[3] == "ушами"
- implode() -объединяет элементы массива со строкой.
$array = array('lastname', 'email', 'phone'); $comma_separated = implode(",", $array); print $comma_separated; // lastname,email,phone
Функции работы со строками в PHP
- addcslashes - Экранирует спецсимволы в стиле языка C
- addslashes - Экранирует спецсимволы в строке
- bin2hex - Преобразует бинарные данные в шестнадцатиричное представление
- chr - Возвращает символ по его коду
- chunk_split - Разбивает строку на фрагменты
- convert_cyr_string - Преобразует строку из одной кириллической кодировки в другую
- count_chars - Возвращает информацию о символах, входящих в строку
- crc32 - Вычисляет CRC32 для строки
- crypt - Необратимое шифрование (хэширование)
- echo - Выводит одну или более строк
- explode - Разбивает строку на подстроки
- fprintf - Записывает отформатированную строку в поток
- get_html_translation_table - Возвращает таблицу преобразований
- hebrev - Преобразует текст на иврите из логической кодировки в визуальную
- hebrevc - Преобразует текст на иврите из логической кодировки в визуальную с преобразованием перевод
- htmlentities - Преобразует символы в соответствующие HTML сущности
- htmlspecialchars - Преобразует специальные символы в HTML сущности
- html_entity_decode - Преобразует HTML сущности в соответствующие символы
- implode - Объединяет элементы массива в строку(массив в строку)
- localeconv - Возвращает информацию о числовых форматах
- ltrim - Удаляет пробелы из начала строки
- md5 - Возвращает MD5 хэш строки
- md5_file - Возвращает MD5 хэш файла
- metaphone - Возвращает ключ metaphone для строки
- nl2br - Вставляет HTML код разрыва строки перед каждым переводом строки
- number_format - Форматирует число с разделением групп
- ord - Возвращает ASCII код символа
- parse_str - Разбирает строку в переменные
- print - Выводит строку
- printf - Выводит отформатированную строку
- quoted_printable_decode - Раскодирует строку, закодированную методом quoted printable
- quotemeta - Экранирует специальные символы
- rtrim - Удаляет пробелы из конца строки
- sha1 - Возвращает SHA1 хэш строки
- sha1_file - Возвращает SHA1 хэш файла
- similar_text - Вычисляет степень похожести двух строк
- soundex - Возвращает ключ soundex для строки
- sprintf - Возвращает отформатированную строку
- sscanf - Разбирает строку в соответствии с заданным форматом
- strcasecmp - Сравнение строк без учета регистра, безопасное для данных в двоичной форме
- strcmp - Сравнение строк, безопасное для данных в двоичной форме
- strcoll - Сравнение строк с учетом текущей локали
- strcspn - Возвращает длину участка в начале строки, не соответствующего маске
- stripcslashes - Удаляет экранирование символов, произведенное функцией addcslashes()
- stripos - Возвращает позицию первого вхождения подстроки без учета регистра
- stripslashes - Удаляет экранирование символов, произведенное функцией addslashes()
- strip_tags - Удаляет HTML и PHP тэги из строки
- stristr - Аналог функции strstr, но независит от регистра
- strlen - Возвращает длину строки
- strnatcasecmp - Сравнение строк без учета регистра с использованием алгоритма
- strnatcmp - Сравнение строк с использованием алгоритма "естественного упорядочения"
- strncasecmp - Сравнение первых n символов строк без учета регистра, безопасное для данных в двоичной форме
- strncmp - Сравнение первых n символов строк без учета регистра, безопасное для данных в двоичной форме
- strpos - Находит первое вхождение подстроки в строку
- strrchr - Находит последнее вхождение символа в строку
- strrev - Переворачивает строку
- strripos - Возвращает позицию последнего вхождения подстроки без учета регистра
- strrpos - Находит последнее вхождение символа в строку
- strspn - Возвращает длину участка в начале строки, соответствующего маске
- strstr - Находит первое вхождение подстроки
- strtok - Разбивает строку
- strtolower - Преобразует строку в нижний регистр
- strtoupper - Преобразует строку в верхний регистр
- strtr - Преобразует заданные символы
- str_ireplace - Регистро-независимый вариант функции str_replace().
- str_pad - Дополняет строку другой строкой до заданной длины
- str_repeat - Возвращает повторяющуюся строку
- str_replace - Заменяет строку поиска на строку замены
- str_rot13 - Выполняет над строкой преобразование ROT13
- str_shuffle - Переставляет символы в строке
- str_split - Преобразует строку в массив
- str_word_count - Возвращает информацию о словах, входящих в строку
- substr - Функция возвращает часть строки
- substr_count - Подсчитывает число вхождений подстроки в строку
- substr_replace - Заменяет часть строки
- trim - Удаляет пробелы из начала и конца строки
- ucfirst - Преобразует первый символ строки в верхний регистр
- ucwords - Преобразует в верхний регистр первый символ каждого слова в строке
- vprintf - Выводит отформатированную строку
- vsprintf - Возвращает отформатированную строку
- wordwrap - Выполняет перенос строки на данное количество символов с использованием символа разрыва строки
Особенности операторов сравнения применительно к строкам.
$one = 1; // Число один. $zero = 0; // Присваиваем число нуль. if ($one == "") echo 1; // Очевидно, не равно - не выводит 1. if ($zero == "") echo 2; //* Внимание! Вопреки ожиданиям печатает 2! if ("" == $zero) echo 3; //* И это тоже не поможет - печатает!.. if ("$zero" == "") echo 4; // Так правильно. if (strval($zero) == "") echo 5; // Так тоже правильно - не выводит 5. if ($zero === "") echo 6; // Лучший способ, но не действует в PHP 3.
chop()
Функция chop( ) возвращает строку после удаления из нее завершающих пропусков и символов новой строки. Синтаксис функции chop( ):
string chop(string строка)
В следующем примере функция chop( ) удаляет лишние символы новой строки:
$header = "Table of Contents\n\n"; $header = chop($header); // $header = "Table of Contents"
str_pad()
Функция str_pad( ) выравнивает строку до определенной длины заданными символами и возвращает отформатированную строку. Синтаксис функции str_pad( ):
string str_pad (string строка, int длина_дополнения [, string дополнение [, int тип_дополнения]])
Если необязательный параметр дополнение не указан, строка дополняется пробелами. В противном случае строка дополняется заданными символами. По умолчанию строка дополняется справа; тем не менее, вы можете передать в параметре тип_дополнения константу STR_PAD_RIGHT, STR_PAD_LEFT или STR_PAD_BOTH, что приведет к дополнению строки в заданном направлении. Пример демонстрирует дополнение строки функцией str_pad( ) с параметрами по умолчанию:
$food = "salad"; print str_pad ($food, 5): // Выводит строку "salad
В следующем примере используются необязательные параметры функции str_pad( ):$header = "Table of Contents"; print str_pad ($header, 5, "=+=+=", STR_PAD_BOTH); // В браузере выводится строка =+=+= Таbе of Contents=+=+="
trim()
Функция trim( ) удаляет псе пропуски с обоих краев строки и возвращает полученную строку. Синтаксис функции trim( ):
string trim (string страна]
К числу удаляемых пропусков относятся и специальные символы \n, \r, \t, \v и \0.
ltrim()
Функция lrim( ) удаляет все пропуски и специальные символы с левого края строки и возвращает полученную строку. Синтаксис функции ltrim( ):
string ltrim (string строка)
Функция удаляет те же специальные символы, что и функция trim( ).
strlen()
Определение длины строкиДлину строки в символах можно определить при помощи функции strlen( ). Синтаксис .функции strlen( ):
int strlen (string строка)
Следующий пример демонстрирует определение длины строки функцией strlen( ):
$string = "hello"; $length = strlen($string); // $length = 5
Сравнение двух строк
Сравнение двух строк принадлежит к числу важнейших строковых операций любого языка. Хотя эту задачу можно решить несколькими разными способами, в РНР существуют четыре функции сравнения строк:
- strcmp()
- strcasecmp()
- strspn()
- strcspn()
strcmp()
Функция strcmp( ) сравнивает две строки с учетом регистра символов. Синтаксис функции strcmp( ): int strcmp (string строка1, string строка2)
После завершения сравнения strcmp( ) возвращает одно из трех возможных значений:
- 0, если строка1 и строка2 совпадают;
- < 0, если строка1 меньше, чем строка2;
- > 0, если строка2 меньше, чем строка1.
В следующем фрагменте сравниваются две одинаковые строки:
$sthng1 = "butter"; $string2 = "butter"; if ((strcmp($string1. $string2)) == 0) : print "Strings are equivalent!"; endif; // Команда if возвращает TRUE
strcasecmp()
Функция strcasecmp( ) работает точно так же, как strcmp( ), за одним исключением - регистр символов при сравнении не учитывается. Синтаксис функции strcasecmp( ):
int strcasecmp (string cтpoкa1, string строка2)
В следующем фрагменте сравниваются две одинаковые строки:
$string1 = "butter"; $string2 = "Butter"; if ((strcmp($string1, $string2)) == 0) : print "Strings are equivalent!"; endif; // Команда if возвращает TRUE
strspn()
Функция strspn( ) возвращает длину первого сегмента строки1, содержащего символы, присутствующие в строке2. Синтаксис функции strspn( ):
int strspn (string строка1, string строка2)
Следующий фрагмент показывает, как функция strspn( ) используется для проверки пароля:
$password = "12345"; if (strspn($password, "1234567890") != strlen($password)) : print "Password cannot consist solely of numbers!"; endif:
strcspn()
Функция strcspn( ) возвращает длину первого сегмента строки1, содержащего символы, отсутствующие в строке2. Синтаксис функции strcspn( ):
int strcspn (string строка1, string строка2)
В следующем фрагменте функция strcspn( ) используется для проверки пароля:
$password = "12345"; if (strcspn($password, "1234567890") == 0) : print "Password cannot consist solely of numbers!"; endif;
Обработка строковых данных без применения регулярных выражений
При обработке больших объемов информации функции регулярных выражений сильно замедляют выполнение программы. Эти функции следует применять лишь при обработке относительно сложных строк, в которых регулярные выражения действительно необходимы. Если же анализ текста выполняется по относительно простым правилам, можно воспользоваться стандартными функциями РНР, которые заметно ускоряют обработку. Все эти функции описаны ниже.
strtok()
Функция strtok( ) разбивает строку на лексемы по разделителям, заданным вторым параметром. Синтаксис функции strtok( ):
string strtok (string строка, string разделители)
У функции strtok( ) есть одна странность: чтобы полностью разделить строку, функцию необходимо последовательно вызвать несколько раз. При очередном вызове функция выделяет из строки следующую лексему. При этом параметр строка задается всего один раз - функция отслеживает текущую позицию в строке до тех пор, пока строка не будет полностью разобрана на лексемы или не будет задан новый параметр строка. Следующий пример демонстрирует разбиение строки по нескольким разделителям:
$info = "WJ Gi1more:wjgilmore@hotmail.com | Columbus, Ohio"; // Ограничители - двоеточие (:), вертикальная черта (|) и запятая (.) $tokens = ":|,"; $tokenized = strtok($info, $tokens); // Вывести элементы массива $tokenized while ($tokenized) : echo "Element = $tokenized<br>"; // Обратите внимание: при последующих вызовах strtok // первый аргумент не передается $tokenized = strtok($tokens); endwhile;
parse_str()
Функция parse_str( ) выделяет в строке пары <переменная-значение> и присваивает значения переменных в текущей области видимости. Синтаксис функции parse_str( ):
void parse_str (string строка)
Функция parse_str( ) особенно удобна при обработке URL, содержащих данные форм HTML или другую расширенную информацию. В следующем примере анализируется информация, переданная через URL. Строка представляет собой стандартный способ передачи данных между страницами либо откомпилированных в гиперссылке, либо введенных в форму HTML:
$url = "fname=wj&lname=gilmore&zip=43210"; parse_str($url); // После выполнения parse_str( ) доступны следующие переменные: // $fname = "wj": // $lname = "gilmore"; // $zip = "43210"
Поскольку эта функция создавалась для работы с URL, она игнорирует символ амперсанд (&).
explode()
Функция explode() делит строку на элементы и возвращает эти элементы в виде массива. Синтаксис функции explode():
array explode (string разделитель, string строка [, int порог])
Разбиение происходит по каждому экземпляру разделителя, причем количество полученных фрагментов может ограничиваться необязательным параметром порог.
Разделение строки функцией explode( ) продемонстрировано в следующем примере:
$info = "wilson | baseball | indians"; $user = explode("|", $info); // $user[0] = "wilson"; // $user[1] = "baseball"; // $user[2] = "Indians";
Функция explode( ) практически идентична функции регулярных выражений POSIX split( ), описанной выше. Главное различие заключается в том, что передача регулярных выражений в параметрах допускается только при вызове split( ).
implode()
Если функция explode( ) разделяет строку на элементы массива, то ее двойник - функция implode( ) - объединяет массив в строку. Синтаксис функции implode( ):
string implode (string разделитель, array фрагменты)
Формирование строки из массива продемонстрировано в следующем примере:
$ohio_cities = array ("Columbus", "Youngstown", "Cleveland", "Cincinnati"); $city_string = implode("l", $ohio_cities); // $city_string = "Columbus | Youngstown | Cleveland | Cincinnati";
У implode( ) имеется псевдоним - функция join( ).
strpos()
Функция strpos( ) находит в строке первый экземпляр заданной подстроки. Синтаксис функции strpos():
int strpos (string строка, string подстрока [, int смещение])
Необязательный параметр offset задает позицию, с которой должен начинаться поиск. Если подстрока не найдена, strpos() возвращает FALSE (0).
В следующем примере определяется позиция первого вхождения даты в файл журнала:
$log = " 206.169.23.11:/www/:2000-08-10 206.169.23.11:/www/logs/:2000-02-04 206.169.23.11:/www/img/:1999-01-31"; // В какой позиции в журнале впервые встречается 1999 год? $pos = strpos($log, "1999"); // $pos = 95. поскольку первый экземпляр "1999" // находится в позиции 95 строки, содержащейся в переменной $log
strrpos()
Функция strrpos( ) находит в строке последний экземпляр заданного символа. Синтаксис функции strrpos( ):
int strpos (string строка, char символ)
По возможностям эта функция уступает своему двойнику - функции strpos( ), поскольку она позволяет искать только отдельный символ, а не всю строку. Если во втором параметре strrpos( ) передается строка, при поиске будет использован только ее первый символ.
str_replace()
Функция str_replace( ) ищет в строке все вхождения заданной подстроки и заменяет их новой подстрокой. Синтаксис функции str_replace( ):
string str_replace (string подстрока, string замена, string строка)
Функция substr_replace( ), описанная ниже в этом разделе, позволяет провести заме ну лишь в определенной части строки. Ниже показано, как функция str_replace( ) используется для проведения глобальной замены в строке.
Если подстрока ни разу не встречается в строке, исходная строка не изменяется:
$favorite_food = "My favorite foods are ice cream and chicken wings"; $favorite_food = str_replace("chicken_wings", "pizza", $favohte_food); // $favorite_food = "My favorite foods are ice cream and pizza"
strstr()
Функция strstr( ) возвращает часть строки, начинающуюся с первого вхождения заданной подстроки. Синтаксис функции strstr( ):
string strstr (string строка, string подстрока)
В следующем примере функция strstr( ) используется для выделения имени домена из URL:
$url = "http://www.apress.com"; $domain - strstr($url, "."); // $domain = ".apress.com"
substr()
Функция substr( ) возвращает часть строки, начинающуюся с заданной начальной позиции и имеющую заданную длину. Синтаксис функции substr( ):
string substr (string строка, int начало [, int длина])
Если необязательный параметр длина не указан, считается, что подстрока начинается с заданной начальной позиции и продолжается до конца строки. При использовании этой функции необходимо учитывать четыре обстоятельства:
- если параметр начало положителен, возвращаемая подстрока начинается с позиции строки с заданным номером;
- если параметр начало отрицателен, возвращаемая подстрока начинается с позиции (длина строки - начало);
- если параметр длина положителен, в возвращаемую подстроку включаются все символы от позиции начало до позиции начало+длина. Если последняя величина превышает длину строки, возвращаются символы до конца строки;
- если параметр длина отрицателен, возвращаемая подстрока заканчивается на заданном расстоянии от конца строки.
Помните о том, что параметр начало определяет смещение от первого символа строки; таким образом, возвращаемая строка в действительности начинается с символа с номером (начало + 1).
Следующий пример демонстрирует выделение части строки функцией substr( ):
$car = "1944 Ford"; Smodel = substr($car, 6); // Smodel = "Ford"
Пример с положительным параметром длина:
$car = "1944 Ford"; $model = substr($car, 0, 4); // $model = "1944"
Пример с отрицательным параметром длина:$car = "1944 Ford"; $model = substr($car, 2, -5); // $model = "44"
substr_count()
Функция substr_count( ) возвращает количество вхождений подстроки в заданную строку. Синтаксис функции substr_count( ): int substr_count (string строка, string подстрока) В следующем примере функция substr_count( ) подсчитывает количество вхождений подстроки ain:$tng_twist = "The rain falls mainly on the plains of Spain"; $count = substr_count($tng_twist, "ain"); // $count = 4
substr_replace()
Функция substr_replace( ) заменяет часть строки, которая начинается с заданной позиции. Если задан необязательный параметр длина, заменяется фрагмент заданной длины; в противном случае производится замена по всей длине заменяющей строки. Синтаксис функции substr_replace( ):
string substr_replace (string строка, string замена, int начало [, int длина])
Параметры начало и длина задаются по определенным правилам:
- если параметр начало положителен, замена начинается с заданной позиции;
- если параметр начало отрицателен, замена начинается с позиции (длина строки -начало);
- если параметр длина положителен, заменяется фрагмент заданной длины;
- если параметр длина отрицателен, замена завершается в позиции (длина строки -длина).
Простая замена текста функцией substr_replace( ) продемонстрирована в следующем примере:
$favs = " 's favorite links"; $name = "Alessia"; // Параметры "0, 0" означают, что заменяемый фрагмент начинается // и завершается в первой позиции строки. $favs - substr_replace($favs, $name, 0, 0); print $favs:
Преобразование строк и файлов к формату HTML и наоборот
Преобразовать строку или целый файл к формату, подходящему для просмотра в web-браузере (или наоборот), проще, чем может показаться на первый взгляд. В РНР для этого существуют специальные функции.
Преобразование текста в HTML
Быстрое преобразование простого текста к формату web-браузера - весьма распространенная задача. В ее решении вам помогут функции, описанные в этом разделе.
nl2br()
Функция nl2br() заменяет все символы новой строки (\n) эквивалентными конструкциями HTML.
Синтаксис функции nl2br():
string nl2br (string строка)
Символы новой строки могут быть как видимыми (то есть явно включенными в строку), так и невидимыми (например, введенными в редакторе). В следующем примере текстовая строка преобразуется в формат HTML посредством замены символов \n разрывами строк:
// Текстовая строка, отображаемая в редакторе. $text_recipe = " Party Sauce recipe: 1 can stewed tomatoes 3 tablespoons fresh lemon juice Stir together, server cold."; // Преобразовать символы новой строки в
При последующем выводе $html_recipe браузеру будет передан следующий текст в формате HTML:
$htinl_recipe = nl2br($text_recipe)Party Sauce recipe:<br> 1 can stewed tomatoes<br> 3 tablespoons fresh lemon juice<br> Stir together, server cold.<br>
htmlentities()
Функция htmlentities( ) преобразует символы в эквивалентные конструкции HTML. Синтаксис функции htmlentities:
string htmlentities (string строка)
В следующем примере производится необходимая замена символов строки для вывода в браузере:
$user_input = "The cookbook, entitled Cafe Francaise' costs < $42.25."; $converted_input = htmlentities($user_input); // $converted_input = "The cookbook, entitled 'Cafè // Fracçiaise' costs < 42.25.";
Функция htmlentities( ) в настоящее время работает только для символов кодировки ISO-8559-1 (ISO-Latin-1). Кроме того, она не преобразует пробелы в , как следовало бы ожидать.
htmlspecialchars()
Функция htmlspecialchars( ) заменяет некоторые символы, имеющие особый смысл в контексте HTML, эквивалентными конструкциями HTML. Синтаксис функции htmlspecialchars( ):
string htmlspecialchars (string строка)
Функция html special chars( ) в настоящее время преобразует следующие символы: & преобразуется в &; " " преобразуется в "; < преобразуется в <; > преобразуется в >.
В частности, эта функция позволяет предотвратить ввод пользователями разметки HTML в интерактивных web-приложениях (например, в электронных форумах). Ошибки, допущенные в разметке HTML, могут привести к тому, что вся страница будет формироваться неправильно. Впрочем, у этой задачи существует и более эффективное решение - полностью удалить теги из строки функцией strip_tags( ).
Следующий пример демонстрирует удаление потенциально опасных символов функцией htmlspeclalchars( ):
$user_input = "I just can't get <enough> of PHP & those fabulous cooking recipes!"; $conv_input = htmlspecialchars($user_input); // $conv_input = "I just can't <<enough>> of PHP & those fabulous cooking recipes!"
Если функция htmlspecialchars( ) используется в сочетании с nl2br( ), то последнюю следует вызывать после htmlspecialchars( ). В противном случае конструкции <br>, сгенерированные при вызове nl2br( ), преобразуются в видимые символы.
get_html_translation_table()
Функция get_html_translation_table( ) обеспечивает удобные средства преобразования текста в эквиваленты HTML Синтаксис функции get_htrril_translation_table( ):
string get_html_translation_table (int таблица)
Функция get_html_translation_table( ) возвращает одну из двух таблиц преобразования (определяется параметром таблица), используемых в работе стандартных функций htmlspecialchars( ) и htmlentities( ). Возвращаемое значение может использоваться в сочетании с другой стандартной функцией, strtr(), для преобразования текста в код HTML.
Параметр таблица принимает одно из двух значений:
- HTML_ENTITIES;
- HTML_SPECIALCHARS.
В следующем примере функция get_html_translation_table( ) используется при преобразовании текста в код HTML:
$string = "La pasta e il piatto piu amato in Italia"; $translate = get_html_translation_table(HTML_ENTITIES); print strtr($string, $translate); // Специальные символы преобразуются в конструкции HTML // и правильно отображаются в браузере.
Кстати, функция array_flip( ) позволяет провести преобразование текста в HTML в обратном направлении и восстановить исходный текст. Предположим, что вместо вывода результата strtr( ) в предыдущем примере мы присвоили его переменной $translated string.
В следующем примере исходный текст восстанавливается функцией array_flip( ):
$translate = array_flip($translate); $translated_string - "La pasta é il piatto piú amato in Italia"; $original_string = strtr($translated_string, $translate); // $original_string = "La pasta e il piatto piu amato in Italia";
strtr()
Функция strtr( ) транслирует строку, то есть заменяет в ней все символы, входящие в строку источник, соответствующими символами строки приемник. Синтаксис функции strtr( ):
string strtr (string строка, string источник, string приемник)
Если строки источник и приемник имеют разную длину, длинная строка усекается до размеров короткой строки.
Существует альтернативный синтаксис вызова strtr( ) с двумя параметрами; в этом случае второй параметр содержит ассоциативный массив, ключи которого соответствуют заменяемым подстрокам, а значения - заменяющим подстрокам. В следующем примере теги HTML заменяются XML-подобными конструкциями:
<? $source = array("<title>" => "<h1>", "</title>" => "</h1>"); $string = "<h1>Today In PHP-Powered News</h1>"; print strtr($string, $source); // Выводится строка "<title>Today in PHP-Powered News</title>" ?>
Преобразование HTML в простой текст
Иногда возникает необходимость преобразовать файл в формате HTML в простой текст. Функции, описанные ниже, помогут вам в решении этой задачи.
strip_tags()
Функция strip_tags( ) удаляет из строки все теги HTML и РНР, оставляя в ней только текст. Синтаксис функции strip_tags( ):
string strip_tags (string строка [, string разрешенные_тerи])
Необязательный параметр разрешенные_теги позволяет указать теги, которые должны пропускаться в процессе удаления.
Ниже приведен пример удаления из строки всех тегов HTML функцией strip_tags( ):
$user_input = "I just love РНР and gourment recipes!"; $stripped_input = strip_tags($user_input); // $stripped_input = "I just love PHP and gourmet recipes!";
В следующем примере удаляются не все, а лишь некоторые теги:
$input = "I <b>love</b> to <a href = \"http://www.eating.com\">eat!</a>!"; $strip_input = strip_tags ($user_input, "<a>"); // $strip_input = "I love to <a href = \"http://www.eating.com\">eat!</a>!";
Удаление тегов из текста также производится функцией fgetss().
get_meta_tags()
Хотя функция get_meta_tags( ) и не имеет прямого отношения к преобразованию текста, зто весьма полезная функция, о которой следует упомянуть. Синтаксис функции get_meta_tags( ):
array get_meta_tags (string имя_файла/URL [, int включение_пути])
Функция get_meta_tags( ) предназначена для поиска в файле HTML тегов МЕТА.
Теги МЕТА содержат информацию о странице, используемую главным образом поисковыми системами. Эти теги находятся внутри пары тегов .... Применение тегов МЕТА продемонстрировано в следующем фрагменте (назовем его example.html, поскольку он будет использоваться в листинге 8.2): [/html]
PHP Recipes [/html] Функция get_meta_tags( ) ищет в заголовке документа теги, начинающиеся словом МЕТА, и сохраняет имена тегов и их содержимое в ассоциативном массиве. В листинге 8.2 продемонстрировано применение этой функции к файлу example.html. Листинг 8.2. Извлечение тегов МЕТА из файла HTML функцией get_meta_tags( )$meta_tags = get_meta_tags("example.html"): // Переменная $meta_tags содержит массив со следующей информацией: // $meta_tags["keywords"] = "PHP, code, recipes, web" // $meta_tags["description"] = "Информация о PHP" // $meta_tags["author"] = "KDG";
Интересная подробность: данные тегов МЕТА можно извлекать не только из файлов, находящихся на сервере, но и из других URL.
Преобразование строки к верхнему и нижнему регистру
В РНР существует четыре функции, предназначенных для изменения регистра строки:
- strtolower();
- strtoupper();
- ucfirst();
- ucwords().
strtolower( )
Функция strtolower( ) преобразует все алфавитные символы строки к нижнему регистру. Синтаксис функции strtolower():
string strtolower(string строка)
Неалфавитные символы функцией не изменяются. Преобразование строки к нижнему регистру функцией strtolower() продемонстрировано в следующем примере:
$sentence = "COOKING and PROGRAMMING PHP are my TWO favorite!"; $sentence = strtolower($sentence); // После вызова функции $sentence содержит строку // "cooking and programming php are my two favorite!"
strtoupper()
Строки можно преобразовывать не только к нижнему, но и к верхнему регистру. Преобразование выполняется функцией strtoupper(), имеющей следующий синтаксис:
string strtoupper (string строка)
Неалфавитные символы функцией не изменяются. Преобразование строки к верхнему регистру функцией strtoupper() продемонстрировано в следующем примере:
$sentence = "cooking and programming PHP are my two favorite!"; $sentence = strtoupper($sentence); // После вызова функции $sentence содержит строку // "COOKING AND PROGRAMMING PHP ARE MY TWO FAVORITE!"
ucfirst()
Функция ucfirst( ) преобразует к верхнему регистру первый символ строки - при условии, что он является алфавитным символом. Синтаксис функции ucfirst():
string ucfirst (string строка)
Неалфавитные символы функцией не изменяются. Преобразование первого символа строки функцией ucfirst() продемонстрировано в следующем примере:
&sentence = "cooking and programming PHP are my two favorite!"; $sentence = ucfirst($sentence); // После вызова функции $sentence содержит строку // "Cooking and programming PHP are mу two favorite!"
ucwords()
Функция ucwords( ) преобразует к верхнему регистру первую букву каждого слова в строке. Синтаксис функции ucwords():
string ucwords (string строка")
Неалфавитные символы функцией не изменяются. "Слово" определяется как последовательность символов, отделенная от других элементов строки пробелами. В следующем примере продемонстрировано преобразование первых символов слов функцией ucwords( ):
$sentence = "cooking and programming PHP are my two favorite!"; $sentence = ucwords($sentence); // После вызова функции $sentence содержит строку // "Cooking And Programming PHP Are My Two Favorite!"
strrchr()
strrchr("строка", "о") - Находит последнее вхождение подстроки
Если подстрока не найдена, возвращает FALSE.
В отличие от strchr(), если искомая строка состоит более чем из одного символа, используется только первый символ.
Если второй параметр не является строкой, он приводится к целому и трактуется как код символа.
// получить последнюю директорию из $PATH $dir = substr(strrchr($PATH, ":"), 1); // получить все после последнего перевода строки $text = "Line 1\nLine 2\nLine 3"; $last = substr(strrchr($text, 10), 1 );
highlight_string()
highlight_string- выделение синтаксиса строки.mixed highlight_string (string str [, bool return])
Функция highlight_string() выводит версию с расцвеченным синтаксисом строки str, используя цвета, определённые во встроенном выделении синтаксиса PHP.
Если второй параметр return имеет значение TRUE, то highlight_string() возвратит версию раскрашенного кода как строку, вместо её печати. Если второй параметр не имеет значение TRUE, highlight_string() возвратит TRUE при успехе, FALSE при неудаче.
Примечание: 1.параметр return стал доступен, начиная с PHP 4.2.0. До этого он работал, как по умолчанию, т.е. FALSE.
2.Функция Highlight_String() различает PHP код по тегам <?php ?>. show_source() - синоним highlight_file(). Для изменения цвета выделения по умолчанию используйте следующие PHP директивы:highlight.bg #FFFFFF highlight.comment #FF8000 highlight.default #0000BB highlight.html #000000 highlight.keyword #007700 highlight.string #DD0000
в .htaccess:php_flag highlight.bg #FFFFFF
в PHP:if(@ini_get('highlight.bg')=='') ...
addslashes()
- Экранирует спецсимволы в строкеВозвращает сроку, в которой перед каждым спецсимволом добавлен обратный слэш (\), например для последующего использования этой строки в запросе к базе данных.
Экранируются одиночная кавычка ('), дойная кавычка ("), обратный слэш (\) и NUL (байт NULL).
$str = "Is your name O'reilly?"; // выводит: Is your name O\'reilly? echo addslashes($str);
stripslashes
- Удаляет экранирование символов, произведенное функцией addslashes() Удаляет экранирующие бэкслэши. (\' преобразуется в ', и т.д.). Двойные бэкслэши (\\) преобразуется в одиночные(\).wordwrap()
Выполняет перенос строки на данное количество символов с использованием символа разрыва строки// Использование wordwrap(). function cite($ourText, $maxlen=60, $prefix="> ") { $st = wordwrap($ourText, $maxlen-strlen($prefix), "\n"); $st = $prefix.str_replace("\n", "\n$prefix", $st); return $st; } echo cite("The first Matrix I designed was quite naturally perfect, it was a work of art - flawless, sublime. A triumph equalled only by its monumental failure. The inevitability of its doom is apparent to me now as a consequence of the imperfection inherent in every human being. Thus, I redesigned it based on your history to more accurately reflect the varying grotesqueries of your nature. However, I was again frustrated by failure.", 20);