PHP strtr vs str_replace бенчмаркинг

Мне любопытно, что самый эффективный способ выполнения строковых преобразований. Учитывая входную строку и набор переводов, какой метод является наиболее эффективным в целом? В настоящее время я использую strtr() , но тестировал различные методы цикла, str_replace() с массивом и т. Д. Метод strtr() самый быстрый в моей системе, в зависимости от переводов, но мне любопытно, есть ли более быстрые методы Я еще не думал.

Если это уместно, мой конкретный случай использования включает в себя преобразование 2-байтовых строк в последовательности ANSI для терминала. Пример:

 // In practice, the number of translations is much greater than one... $out = strtr("|rThis should be red", array('|r' => "\033[31m"));

Related of "PHP strtr vs str_replace бенчмаркинг"

Для простых замещений strtr кажется более быстрым, но когда у вас есть сложные замены со многими строками поиска, похоже, что str_replace имеет край.

Я сделал тривиальный ориентир для личных потребностей по двум функциям. Цель состоит в том, чтобы изменить нижний регистр «e» на верхний регистр «E».

 <?php $stime = time(); for ($i = 0; $i < 1000000; $i++) { str_replace('e', 'E', "Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed non risus. Suspendisse lectus tortor, dignissim sit amet, adipiscing nec, ultricies sed, dolor. Cras elementum ultrices diam. Maecenas ligula massa, varius a, semper congue, euismod non, mi. Proin porttitor, orci nec nonummy molestie, enim est eleifend mi, non fermentum diam nisl sit amet erat. Duis semper. Duis arcu massa, scelerisque vitae, consequat in, pretium a, enim. Pellentesque congue. Ut in risus volutpat libero pharetra tempor. Cras vestibulum bibendum augue. Praesent egestas leo in pede. Praesent blandit odio eu enim. Pellentesque sed dui ut augue blandit sodales. Vestibulum ante ipsum primis in faucibus orci luctus et ultrices posuere cubilia Curae; Aliquam nibh. Mauris ac mauris sed pede pellentesque fermentum. Maecenas adipiscing ante non diam sodales hendrerit."); } echo time() - $stime . "\n"; ?>

Этот код с использованием str_replace запускается через 6 секунд. Теперь то же самое с функцией strtr :

 <?php $stime = time(); for ($i = 0; $i < 1000000; $i++) { strtr("Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed non risus. Suspendisse lectus tortor, dignissim sit amet, adipiscing nec, ultricies sed, dolor. Cras elementum ultrices diam. Maecenas ligula massa, varius a, semper congue, euismod non, mi. Proin porttitor, orci nec nonummy molestie, enim est eleifend mi, non fermentum diam nisl sit amet erat. Duis semper. Duis arcu massa, scelerisque vitae, consequat in, pretium a, enim. Pellentesque congue. Ut in risus volutpat libero pharetra tempor. Cras vestibulum bibendum augue. Praesent egestas leo in pede. Praesent blandit odio eu enim. Pellentesque sed dui ut augue blandit sodales. Vestibulum ante ipsum primis in faucibus orci luctus et ultrices posuere cubilia Curae; Aliquam nibh. Mauris ac mauris sed pede pellentesque fermentum. Maecenas adipiscing ante non diam sodales hendrerit.", 'e', 'E'); } echo time() - $stime . "\n"; ?>

Это заняло всего 4 секунды.

Так, как указано T0xicCode, для этого особо простого случая strtr действительно быстрее str_replace , но разница не столь значительна.

strtr () лучше всего работает с прямыми заменами символов. Более длинные строки дают str_replace () ребро.

Например, приведенный ниже код дает следующие результаты в моей (общедоступной веб-хостинге):

 Execution timings on PHP 7.0.6: test_strtr(): 0.37670969963074; result: Lorem ipsum dolor sit amet\, \tconsectetur adipiscing elit\, \nsed do eiusmod \%tempor \'incididunt\' ut labore et DELIMITER dolore\; trunc8 \\magna \"aliqua\". test_str_ireplace(): 0.73557734489441; result: Lorem ipsum dolor sit amet, \tconsectetur adipiscing elit, \\nsed do eiusmod \%tempor \'incididunt\' ut labore et de-limiter dolore\; trunc8 \\magna \"aliqua\". test_str_replace(): 0.28119778633118; result: Lorem ipsum dolor sit amet, \tconsectetur adipiscing elit, \\nsed do eiusmod \%tempor \'incididunt\' ut labore et DELIMITER dolore\; trunc8 \\magna \"aliqua\".

Когда мы вынимаем «разделитель» и «усекаемся», результаты становятся:

 Execution timings on PHP 7.0.6: test_strtr(): 0.14877104759216; result: Lorem ipsum dolor sit amet\, \tconsectetur adipiscing elit\, \nsed do eiusmod \%tempor \'incididunt\' ut labore et DELIMITER dolore\; truncate \\magna \"aliqua\". test_str_ireplace(): 0.58186745643616; result: Lorem ipsum dolor sit amet, \tconsectetur adipiscing elit, \\nsed do eiusmod \%tempor \'incididunt\' ut labore et DELIMITER dolore\; truncate \\magna \"aliqua\". test_str_replace(): 0.20531725883484; result: Lorem ipsum dolor sit amet, \tconsectetur adipiscing elit, \\nsed do eiusmod \%tempor \'incididunt\' ut labore et DELIMITER dolore\; truncate \\magna \"aliqua\".

Итак, с PHP 7.0.6 strtr () страдает значительным штрафом с более длинными заменами. Код:

 const LOOP = 333; const SQL_ESCAPE_MAP = array( // see https://www.owasp.org/index.php/SQL_Injection_Prevention_Cheat_Sheet#MySQL_Escaping "\x00" => '\x00', // NUL "\n" => '\n', // LF "\r" => '\r', // CR "\\" => '\\\\', // backslash "'" => "\'", // single quote '"' => '\"', // double quote "\x1a" => '\x1a', // SUB or \Z (substitute for an invalid character) "\t" => '\t', // TAB "\x08" => '\b', // BS '%' => '\%', // Percent '_' => '\_', // Underscore ';' => '\;', // Semicolon ',' => '\,', // Comma 'delimiter' => 'de-limiter', // SQL delimiter keyword 'truncate' => 'trunc8', // SQL truncate keyword ); const SQL_SEARCH = array("\x00", "\n", "\r", "\\", "'", '"', "\x1a", "\t", "\x08", "%", ";", 'delimiter', 'truncate'); const SQL_REPLACE = array('\x00','\n','\r','\\\\',"\'",'\"', '\x1a', '\t', '\b', '\%', '\;', 'de-limiter', 'trunc8'); const TEST_STRING = "Lorem ipsum dolor sit amet, \tconsectetur adipiscing elit, \nsed do eiusmod %tempor 'incididunt' ut labore et DELIMITER dolore; truncate \magna \"aliqua\"."; function test_strtr() { for($i= 0; $i < LOOP; $i++) { $new_string = strtr(TEST_STRING, SQL_ESCAPE_MAP); } return $new_string; } function test_str_ireplace() { for($i= 0; $i < LOOP; $i++) { $new_string = str_ireplace(SQL_SEARCH, SQL_REPLACE, TEST_STRING); } return $new_string; } function test_str_replace() { for($i= 0; $i < LOOP; $i++) { $new_string = str_replace(SQL_SEARCH, SQL_REPLACE, TEST_STRING); } return $new_string; } $timings = array( 'test_strtr' => 0, 'test_str_ireplace' => 0, 'test_str_replace' => 0, ); for($i= 0; $i < LOOP; $i++) { foreach(array_keys($timings) as $func) { $start = microtime(true); $$func = $func(); $timings[$func] += microtime(true) - $start; } } echo '<pre>Execution timings on PHP ' . phpversion('tidy') . ":\n"; foreach(array_keys($timings) as $func) { echo $func . '(): ' . $timings[$func] . '; result: ' . $$func . "\n"; } echo "</pre>\n";

Заметка:

Этот примерный код не предназначен как производственная альтернатива mysqli :: real_escape_string вместо соединения с БД (есть проблемы вокруг двоичного / многобайтового кодированного ввода).
Ясно, что различия незначительны. По мнемонологическим причинам (как организованы совпадения и замены) я предпочитаю ассоциативный массив, который strtr берет изначально. (Не то, что этого не может быть достигнуто с помощью array_keys () для str_replace.) Различия в этом случае, безусловно, находятся в сфере микро-оптимизации и могут быть очень разными с разными входами. Если вам нужно обрабатывать огромные строки тысячи раз в секунду, сравните свои конкретные данные.