URL / HTML-экранирование / кодирование

Меня всегда путали с кодировкой / экранированием URL / HTML. Я использую PHP, поэтому хочу очистить что-то.

Могу ли я сказать, что я всегда должен использовать

  • urlencode : для отдельных частей строки запроса

     $url = 'http://test.com?param1=' . urlencode('some data') . '&param2=' . urlencode('something else'); 
  • htmlentities : для экранирования специальных символов, таких как <> чтобы при правильном отображении браузером

Будут ли какие-либо другие места, где я могу использовать каждую функцию. Я не хорош во всех этих побегах, всегда смущен ими

Во-первых, вы не должны использовать htmlentites около 99% времени. Вместо этого вы должны использовать htmlspecialchars() для экранирования текста для использования внутри документов xml / html. htmlentities полезны только для отображения символов, которые пользовательский htmlentities символов вы не можете отобразить (полезно, если ваши страницы находятся в ASCII, но у вас есть некоторые символы UTF-8, которые вы хотите отобразить). Вместо этого просто сделайте всю страницу UTF-8 (это не сложно) и сделайте с ней.

Что касается urlencode , вы ударяете ноготь по голове.

Итак, напомню:

  • Внутри HTML:

     <b><?php echo htmlspecialchars($string, ENT_QUOTES, "UTF-8"); ?></b> 
  • Внутри URL:

     $url = '?foo='.urlencode('bar'); 

Это верно. Хотя – htmlspecialchars в порядке, до тех пор, пока вы получаете свои кодировки прямо. Что вы должны делать в любом случае. Поэтому я, как правило, использую это, поэтому рано узнаю, не испортил ли он это.

Также обратите внимание, что если вы поместите URL-адрес в html-контекст (скажем – в href a -tag), вам нужно это избежать. Поэтому вы часто увидите что-то вроде:

 echo "<a href='" . htmlspecialchars("?foo=".urlencode($foo)) . "'>clicky</a>"