Использование регулярных выражений для анализа HTML: почему бы и нет?



похоже, что каждый вопрос о stackoverflow, где asker использует регулярное выражение для захвата некоторой информации из HTML, неизбежно будет иметь "ответ", который говорит, что не следует использовать регулярное выражение для разбора HTML.



Почему бы и нет? Я знаю, что есть цитата-unquote "реальные" Парсеры HTML там, как Красивый Суп, и я уверен, что они мощные и полезные, но если вы просто делаете что-то простое, быстрое или грязное, то зачем использовать что-то настолько сложное, когда несколько регулярных выражений заявления будут работать просто отлично?



кроме того, есть ли что-то фундаментальное, что я не понимаю о регулярных выражениях, что делает их плохим выбором для разбора в целом?

561   0  

Comments

    Ничего не найдено.