Поиск подстроки при игнорировании тегов HTML

Мне нужно совместить части строки, игнорируя теги HTML. Это означает, что пользователь хочет искать строку «foo и foo1» в исходном коде.

Two strings, <u>foo</u> and foo1 

Из-за тегов он не получил матч.

Я пробовал регулярное выражение, но поскольку теги могут и не должны быть там, это кажется слишком сложным.

Это не серверный скрипт. Это приложение будет запускаться с консоли.

Чтобы быть более конкретным: это для подсветки синтаксиса. Поэтому пользователь хочет, чтобы «foo и foo1» был курсивным, но часть его уже подчеркнута и не будет соответствовать в любом случае. Вот почему я не могу удалить строку.