Python split () без удаления разделителя [дубликат]

Question

Python split () без удаления разделителя [дубликат]

этот вопрос уже есть ответ здесь:

в Python, как мне разделить строку и сохранить разделители?

9 ответов

этот код почти делает то, что мне нужно..

for line in all_lines:

    s = line.split('>')

кроме того, что он удаляет все разделители'>'.

и

<html><head>

получается в

['<html','<head']

есть ли способ использовать метод split (), но сохранить разделитель, вместо того, чтобы удалить его?

С этими результатами..

['<html>','<head>']

932 4

python delimiter split

4 ответов:

Comments

Ничего не найдено.

P.Melch · Accepted Answer · 2017-02-15 06:02:24

d = ">"
for line in all_lines:
    s =  [e+d for e in line.split(d) if e]

gb. · Accepted Answer · 2011-10-23 17:54:32

Если вы анализируете HTML с разделениями, вы, скорее всего, делаете это неправильно, за исключением того, что вы пишете одноразовый скрипт, направленный на фиксированный и безопасный файл контента. Если он должен работать на любом HTML-входе, как вы будете обрабатывать что-то вроде <a title='growth > 8%' href='#something'>?

в любом случае, для меня работает следующее:
>>> import re
>>> re.split('(<[^>]*>)', '<body><table><tr><td>')[1::2]
['<body>', '<table>', '<tr>', '<td>']

Óscar López · Accepted Answer · 2011-10-23 15:45:34

Как насчет этого:
import re
s = '<html><head>'
re.findall('[^>]+>', s)

orangething · Accepted Answer · 2011-10-23 15:33:50

просто разделите его, а затем для каждого элемента в массиве/списке (кроме последнего) добавьте к нему трейлинг">".