PHP-символы в Юникоде

Вот ссылка, которую я нашел, у которой даже есть персонаж, с которым мне нужно играть для других моих проектов.

http://www.fileformat.info/info/unicode/char/2446/index.htm

На этой странице есть поле с надписью «Кодировки». И мне интересно о некоторых рядах.

Мне, очевидно, нужен курс по подобным вещам, но мне интересно, какая разница между «HTML Entity (десятичным)» и «HTML Entity (hex)».

Самое смешное, что меня смущает, я бросаю этих персонажей на веб-страницу, и они отлично отображаются. Но я не указал кодировку UTF-8 на php-странице.

<?php $string1 = '⑆'; $string2 = '⑆'; echo $string1; echo '<br>'; echo $string2; ?> 

Знает ли браузер, как отображать оба автоматически? И чтобы сделать его более странным, я могу видеть только те персонажи на моем Mac, в Firefox. Но мой оконный ящик не хочет их показывать. Я протестировал его в chrome и firefox. Нужно ли мне показывать браузеру правильно? Или это модификация операционной системы?

Вы можете использовать любую «HTML-сущность» в любой кодировке и на практике, если вы установили соответствующие шрифты, каждый браузер будет работать нормально. Ну, он был создан для отображения символов, которые не включены в текущую кодировку. В ваших ситуациях это выглядит. Вам нужно установить некоторые шрифты в окне Windows.

С другой стороны, это не имеет ничего общего с PHP.

Они оба являются действительными числовыми объектами HTML, и браузер действительно знает, как их декодировать. Разница – это первое шестнадцатеричное число, а последнее – десятичное.

0x2446 = 9286

Заметим, что 0x означает шестнадцатеричный.

Также имейте в виду, что всегда рекомендуется, чтобы ваш сервер явно указывал кодировку. W3C объясняет, как это сделать. UTF-8 – хороший выбор.

Если вы используете кодировку Unicode, вы всегда можете разместить символ на своей странице, поэтому вам не нужно использовать объекты.

Точнее, ни одна из ссылок на сущность не является. &amp; является ссылкой на сущность, которая ссылается на объект с именем amp, который определяется как:

 <!ENTITY amp CDATA "&#38;" -- ampersand, U+0026 ISOnum --> 

Здесь вы можете видеть, что значение объекта – это еще одна ссылка: &#38; ,

&#x2446; и &#9286; являются «справедливыми» символьными ссылками (точнее, числовыми символьными ссылками ) и ссылаются на символы, указывая положение кода символа в универсальном наборе символов , т.е. набор символов Юникода.