Меня всегда путали с кодировкой / экранированием URL / HTML. Я использую PHP, поэтому хочу очистить что-то.
Могу ли я сказать, что я всегда должен использовать
urlencode
: для отдельных частей строки запроса
$url = 'http://test.com?param1=' . urlencode('some data') . '¶m2=' . urlencode('something else');
htmlentities
: для экранирования специальных символов, таких как <>
чтобы при правильном отображении браузером
Будут ли какие-либо другие места, где я могу использовать каждую функцию. Я не хорош во всех этих побегах, всегда смущен ими
Во-первых, вы не должны использовать htmlentites
около 99% времени. Вместо этого вы должны использовать htmlspecialchars()
для экранирования текста для использования внутри документов xml / html. htmlentities
полезны только для отображения символов, которые пользовательский htmlentities
символов вы не можете отобразить (полезно, если ваши страницы находятся в ASCII, но у вас есть некоторые символы UTF-8, которые вы хотите отобразить). Вместо этого просто сделайте всю страницу UTF-8 (это не сложно) и сделайте с ней.
Что касается urlencode
, вы ударяете ноготь по голове.
Итак, напомню:
Внутри HTML:
<b><?php echo htmlspecialchars($string, ENT_QUOTES, "UTF-8"); ?></b>
Внутри URL:
$url = '?foo='.urlencode('bar');
Это верно. Хотя – htmlspecialchars
в порядке, до тех пор, пока вы получаете свои кодировки прямо. Что вы должны делать в любом случае. Поэтому я, как правило, использую это, поэтому рано узнаю, не испортил ли он это.
Также обратите внимание, что если вы поместите URL-адрес в html-контекст (скажем – в href
a
-tag), вам нужно это избежать. Поэтому вы часто увидите что-то вроде:
echo "<a href='" . htmlspecialchars("?foo=".urlencode($foo)) . "'>clicky</a>"