Articles of unicode

Конкретный японский символ не отображается правильно в PDF

Я пытаюсь напечатать азиатских символов в PDF. Несмотря на то, что мне удавалось отображать азиатские символы в формате PDF, я столкнулся с небольшой проблемой в одном из символов, которые отображаются. Я использовал fireflysung.ttf для отображения символов, а азиатское слово ス ズ キ グ ル ー プ 行動 指針 – ス テ ッ プ 1. Но […]

JavaScript Unicode Regex – Дальность не соответствует порядку в символьном классе

Почему следующий код дает ошибку «Недействительность диапазона в символьном классе»? var min_wordsafe_length = 1; var max_length = 20; var string = 'some-slug-like-string-with-!@£!%-special-chars-'; var PREG_CLASS_UNICODE_WORD_BOUNDARY = [ '\\x{0}-\\x{2F}\\x{3A}-\\x{40}\\x{5B}-\\x{60}\\x{7B}-\\x{A9}\\x{AB}-\\x{B1}\\x{B4}', '\\x{B6}-\\x{B8}\\x{BB}\\x{BF}\\x{D7}\\x{F7}\\x{2C2}-\\x{2C5}\\x{2D2}-\\x{2DF}', '\\x{2E5}-\\x{2EB}\\x{2ED}\\x{2EF}-\\x{2FF}\\x{375}\\x{37E}-\\x{385}\\x{387}\\x{3F6}', '\\x{482}\\x{55A}-\\x{55F}\\x{589}-\\x{58A}\\x{5BE}\\x{5C0}\\x{5C3}\\x{5C6}', '\\x{5F3}-\\x{60F}\\x{61B}-\\x{61F}\\x{66A}-\\x{66D}\\x{6D4}\\x{6DD}\\x{6E9}', '\\x{6FD}-\\x{6FE}\\x{700}-\\x{70F}\\x{7F6}-\\x{7F9}\\x{830}-\\x{83E}', '\\x{964}-\\x{965}\\x{970}\\x{9F2}-\\x{9F3}\\x{9FA}-\\x{9FB}\\x{AF1}\\x{B70}', '\\x{BF3}-\\x{BFA}\\x{C7F}\\x{CF1}-\\x{CF2}\\x{D79}\\x{DF4}\\x{E3F}\\x{E4F}', '\\x{E5A}-\\x{E5B}\\x{F01}-\\x{F17}\\x{F1A}-\\x{F1F}\\x{F34}\\x{F36}\\x{F38}', '\\x{F3A}-\\x{F3D}\\x{F85}\\x{FBE}-\\x{FC5}\\x{FC7}-\\x{FD8}\\x{104A}-\\x{104F}', '\\x{109E}-\\x{109F}\\x{10FB}\\x{1360}-\\x{1368}\\x{1390}-\\x{1399}\\x{1400}', '\\x{166D}-\\x{166E}\\x{1680}\\x{169B}-\\x{169C}\\x{16EB}-\\x{16ED}', '\\x{1735}-\\x{1736}\\x{17B4}-\\x{17B5}\\x{17D4}-\\x{17D6}\\x{17D8}-\\x{17DB}', '\\x{1800}-\\x{180A}\\x{180E}\\x{1940}-\\x{1945}\\x{19DE}-\\x{19FF}', '\\x{1A1E}-\\x{1A1F}\\x{1AA0}-\\x{1AA6}\\x{1AA8}-\\x{1AAD}\\x{1B5A}-\\x{1B6A}', '\\x{1B74}-\\x{1B7C}\\x{1C3B}-\\x{1C3F}\\x{1C7E}-\\x{1C7F}\\x{1CD3}\\x{1FBD}', '\\x{1FBF}-\\x{1FC1}\\x{1FCD}-\\x{1FCF}\\x{1FDD}-\\x{1FDF}\\x{1FED}-\\x{1FEF}', '\\x{1FFD}-\\x{206F}\\x{207A}-\\x{207E}\\x{208A}-\\x{208E}\\x{20A0}-\\x{20B8}', '\\x{2100}-\\x{2101}\\x{2103}-\\x{2106}\\x{2108}-\\x{2109}\\x{2114}', '\\x{2116}-\\x{2118}\\x{211E}-\\x{2123}\\x{2125}\\x{2127}\\x{2129}\\x{212E}', '\\x{213A}-\\x{213B}\\x{2140}-\\x{2144}\\x{214A}-\\x{214D}\\x{214F}', '\\x{2190}-\\x{244A}\\x{249C}-\\x{24E9}\\x{2500}-\\x{2775}\\x{2794}-\\x{2B59}', '\\x{2CE5}-\\x{2CEA}\\x{2CF9}-\\x{2CFC}\\x{2CFE}-\\x{2CFF}\\x{2E00}-\\x{2E2E}', '\\x{2E30}-\\x{3004}\\x{3008}-\\x{3020}\\x{3030}\\x{3036}-\\x{3037}', '\\x{303D}-\\x{303F}\\x{309B}-\\x{309C}\\x{30A0}\\x{30FB}\\x{3190}-\\x{3191}', '\\x{3196}-\\x{319F}\\x{31C0}-\\x{31E3}\\x{3200}-\\x{321E}\\x{322A}-\\x{3250}', '\\x{3260}-\\x{327F}\\x{328A}-\\x{32B0}\\x{32C0}-\\x{33FF}\\x{4DC0}-\\x{4DFF}', '\\x{A490}-\\x{A4C6}\\x{A4FE}-\\x{A4FF}\\x{A60D}-\\x{A60F}\\x{A673}\\x{A67E}', '\\x{A6F2}-\\x{A716}\\x{A720}-\\x{A721}\\x{A789}-\\x{A78A}\\x{A828}-\\x{A82B}', […]

preg_match unicode parsing

Я хочу соответствовать подмножеству символов unicode / UTF-8 (отмеченный желтым здесь http://solomon.ie/unicode/ ), из моего исследования я придумал следующее: // ensure it's valid unicode / get rid of invalid UTF8 chars $text = iconv("UTF-8","UTF-8//IGNORE",$text); // and just allow a basic english…ish.. chars through – no controls, chinese etc $match_list = "\x{09}\x{0a}\x{0d}\x{20}-\x{7e}"; // basic ascii chars […]

Чтение UNICODE CSV с использованием PHP

Мне приходится сталкиваться с проблемой чтения символов Unicode из CSV-файла с помощью PHP. Ниже приведен скриншот файла ccv UNICODE. Код PHP, который я использую, приведен ниже. $delimiter = ","; $row = 1; $handle = fopen($filePath, "r"); while (($data = fgetcsv($handle, 1000, $delimiter)) !== FALSE) { $num = count($data); $row++; for ($c=0; $c < $num; $c++) […]

Удаление символа маркера unicode

У меня возникла проблема, которая, как мне кажется, связана с текстом unicode. Когда пользователь вводит строку с символом маркера unicode, mysql не может сохранить это поле (остальная часть запроса на обновление работает, хотя). Вот как я пытался справиться с этим. $str = "· Close up the server"; $str = preg_replace("\u2022", "&bull;", $str); … однако это […]

Использование awk для удаления знака Byte-order

Как бы выглядел скрипт awk (предположительно однострочный) для удаления спецификации ? Спецификация: распечатать каждую строку после первого ( NR > 1 ) для первой строки: если она начинается с #FE #FF или #FF #FE , удалите их и распечатайте остальные

Преобразование кода Unicode указывает на UTF-8

В настоящее время у меня есть что-то вроде этого \u4eac\u90fd и я хочу преобразовать его в UTF-8, чтобы я мог вставить его в базу данных.

Шрифт Bangla (Unicode) не корректно отображается в tcpdf

Я столкнулся с проблемой создания pdf в php с помощью библиотеки TCPDF. Мне нужно правильно отобразить шрифт bangla. Я попытался добавить шрифт bangla (то есть SolaimanLipi.ttf, SutonnyOMJ.ttf, Siyamrupali.ttf, Nikosh.ttf и т. Д.). Я вижу шрифт bangla в формате pdf, но шрифт отображается неправильно. Его неуместное слово. Добавив этот шрифт, я вижу, что в каталоге / […]

Ошибка PHP preg_replace () с недопустимой точкой кода Unicode

У меня возникли проблемы с использованием стороннего API, который вызывает следующую ошибку PHP preg_replace(): Compilation failed: disallowed Unicode code point (>= 0xd800 && <= 0xdfff) at offset 42 in /…/SoapClient.php on line 20 Может ли кто-нибудь помочь мне с пониманием того, что означает это регулярное выражение, [\x{0}-\x{8}\x{B}-\x{C}\x{E}-\x{1F}\x{D800}-\x{DFFF}] Это значение, которое оно пытается сопоставить 5f42caa3-1f41-4ff3-8b6c-3f79e45ed0f1 Это […]

Как преобразовать форму Unicode NCR в ее первоначальную форму на PHP?

Чтобы избежать «символов монстров», я выбираю форму Unicode NCR для хранения неанглийских символов в базе данных (MySQL). Тем не менее, плагин PDF, который я использую (FPDF), не принимает форму Unicode NCR как правильный формат; он отображает данные непосредственно так: 這個一個例子 но я хочу, чтобы он отображался следующим образом: 這個 一個 例子 Есть ли способ конвертировать […]