Ситуация такая: есть на диске много html файлов, с них нужно повырезать лишнее (некоторые элементы , строки). Проблема в том, что регулярки не берут часть элементов, надо играться. Может есть какой-то готовый парсер, где можно выбрать элементы, и удалить их? Пробовал phpQuery, но там можно только выбирать, а мне наоборот надо, скажем удалить все скрипты из документа. Посоветуйте, куда копать.
Есть. Только работает строго наоборот - нужно перечислять то, что необходимо оставить https://www.php.net/manual/ru/function.strip-tags.php