Ответ 1
Регулярное выражение должно делать трюк.
import re
s = re.sub('<br\s*?>', '\n', yourTextHere)
Надеюсь, это поможет!
Я пытаюсь извлечь текст, используя BeautifulSoup
. Для этой цели я использую функцию get_text()
.
Моя проблема в том, что текст содержит теги </br>
, и мне нужно преобразовать их в конечные строки. как я могу это сделать?
Регулярное выражение должно делать трюк.
import re
s = re.sub('<br\s*?>', '\n', yourTextHere)
Надеюсь, это поможет!
Вы можете сделать это, используя сам объект BeautifulSoup или любой его элемент:
for br in soup.find_all("br"):
br.replace_with("\n")