PHP, проблема с unicode str_pad

Я просто пытаюсь зафиксировать $str до 5 символов, но не смог.

 $str = "nü"; echo str_pad($str, 5, "ü"); // give nüü 

Я знаю, что это проблема с юникодом и много искала, но не повезло. Я пробовал такие вещи, как;

 echo str_pad($str, 4 + mb_strlen($s), $s); echo str_pad($str, 5 + mb_strlen($s), $s); 

Также я попробовал это http://www.php.net/manual/de/function.str-pad.php#89754 и увидел это https://stackoverflow.com/a/11871948/362780 .

Любой опыт по этой проблеме?

Благодарю.

Я думаю, вам нужно заглянуть внутрь php.net (здесь: http://php.net/str_pad#111147 ). Но я немного изменил его.

Примечание. Не забудьте вызвать это до mb_internal_encoding("utf-8"); ,

 mb_internal_encoding("utf-8"); function str_pad_unicode($str, $pad_len, $pad_str = ' ', $dir = STR_PAD_RIGHT) { $str_len = mb_strlen($str); $pad_str_len = mb_strlen($pad_str); if (!$str_len && ($dir == STR_PAD_RIGHT || $dir == STR_PAD_LEFT)) { $str_len = 1; // @debug } if (!$pad_len || !$pad_str_len || $pad_len <= $str_len) { return $str; } $result = null; if ($dir == STR_PAD_BOTH) { $length = ($pad_len - $str_len) / 2; $repeat = ceil($length / $pad_str_len); $result = mb_substr(str_repeat($pad_str, $repeat), 0, floor($length)) . $str . mb_substr(str_repeat($pad_str, $repeat), 0, ceil($length)); } else { $repeat = ceil($str_len - $pad_str_len + $pad_len); if ($dir == STR_PAD_RIGHT) { $result = $str . str_repeat($pad_str, $repeat); $result = mb_substr($result, 0, $pad_len); } else if ($dir == STR_PAD_LEFT) { $result = str_repeat($pad_str, $repeat); $result = mb_substr($result, 0, $pad_len - (($str_len - $pad_str_len) + $pad_str_len)) . $str; } } return $result; } $t = STR_PAD_LEFT; $s = '...'; $as = 'AO'; $ms = 'ÄÖ'; echo "<pre>\n"; for ($i = 3; $i <= 1000; $i++) { $s1 = str_pad($s, $i, $as, $t); // can not inculde unicode char!!! $s2 = str_pad_unicode($s, $i, $ms, $t); $l1 = strlen($s1); $l2 = mb_strlen($s2); echo "len $l1: $s1 \n"; echo "len $l2: $s2 \n"; echo "\n"; if ($l1 != $l2) die("Fail!"); } echo "</pre>"; 

Тестирование здесь: http://codepad.viper-7.com/3jTEgt

Проще и эффективнее. http://3v4l.org/UnXTF

 <?php function mb_str_pad($str, $pad_len, $pad_str = ' ', $dir = STR_PAD_RIGHT, $encoding = NULL) { $encoding = $encoding === NULL ? mb_internal_encoding() : $encoding; $padBefore = $dir === STR_PAD_BOTH || $dir === STR_PAD_LEFT; $padAfter = $dir === STR_PAD_BOTH || $dir === STR_PAD_RIGHT; $pad_len -= mb_strlen($str, $encoding); $targetLen = $padBefore && $padAfter ? $pad_len / 2 : $pad_len; $strToRepeatLen = mb_strlen($pad_str, $encoding); $repeatTimes = ceil($targetLen / $strToRepeatLen); $repeatedString = str_repeat($pad_str, max(0, $repeatTimes)); // safe if used with valid unicode sequences (any charset) $before = $padBefore ? mb_substr($repeatedString, 0, floor($targetLen), $encoding) : ''; $after = $padAfter ? mb_substr($repeatedString, 0, ceil($targetLen), $encoding) : ''; return $before . $str . $after; } // same random testing... foreach([STR_PAD_BOTH, STR_PAD_LEFT, STR_PAD_RIGHT] as $padType) { echo str_pad("FOO", 11, "aeo", $padType) . "\n"; echo mb_str_pad("FOO", 11, "àèò", $padType, "UTF-8") . "\n"; echo str_pad("FOO", 10, "aeo", $padType) . "\n"; echo mb_str_pad("FOO", 10, "àèò", $padType, "UTF-8") . "\n"; echo str_pad("BAAZ", 11, "aeo", $padType) . "\n"; echo mb_str_pad("BAAZ", 11, "àèò", $padType, "UTF-8") . "\n"; echo str_pad("BAAZ", 10, "aeo", $padType) . "\n"; echo mb_str_pad("BAAZ", 10, "àèò", $padType, "UTF-8") . "\n"; echo str_pad("FOOBAR", 6, "aeo", $padType) . "\n"; echo mb_str_pad("FOOBAR", 6, "àèò", $padType, "UTF-8") . "\n"; echo str_pad("FOOBAR", 1, "aeo", $padType) . "\n"; echo mb_str_pad("FOOBAR", 1, "àèò", $padType, "UTF-8") . "\n"; echo str_pad("FOOBAR", 0, "aeo", $padType) . "\n"; echo mb_str_pad("FOOBAR", 0, "àèò", $padType, "UTF-8") . "\n"; echo str_pad("FOOBAR", -10, "aeo", $padType) . "\n"; echo mb_str_pad("FOOBAR", -10, "àèò", $padType, "UTF-8") . "\n"; echo "--\n"; } ?> 

Вам нужна многобайтовая версия str_pad() , как str_pad() ниже. Это вдохновляет исходный код str_pad() .

 function mb_str_pad($input, $pad_length, $pad_string = ' ', $pad_type = STR_PAD_RIGHT, $encoding = 'UTF-8') { $input_length = mb_strlen($input, $encoding); $pad_string_length = mb_strlen($pad_string, $encoding); if ($pad_length <= 0 || ($pad_length - $input_length) <= 0) { return $input; } $num_pad_chars = $pad_length - $input_length; switch ($pad_type) { case STR_PAD_RIGHT: $left_pad = 0; $right_pad = $num_pad_chars; break; case STR_PAD_LEFT: $left_pad = $num_pad_chars; $right_pad = 0; break; case STR_PAD_BOTH: $left_pad = floor($num_pad_chars / 2); $right_pad = $num_pad_chars - $left_pad; break; } $result = ''; for ($i = 0; $i < $left_pad; ++$i) { $result .= mb_substr($pad_string, $i % $pad_string_length, 1, $encoding); } $result .= $input; for ($i = 0; $i < $right_pad; ++$i) { $result .= mb_substr($pad_string, $i % $pad_string_length, 1, $encoding); } return $result; } $str = "nü"; $pad = "ü"; echo mb_str_pad($str, 5, $pad); 

Попробуйте это (это может выглядеть как неудачное, но это также проверка кодировки):

 <?php function mb_str_pad ($input, $pad_length, $pad_string, $pad_style, $encoding="UTF-8") { return str_pad($input, strlen($input)-mb_strlen($input,$encoding)+$pad_length, $pad_string, $pad_style); } ?> 

Источник