Как получить все после последней косой черты в URL?

Question

Как получить все после последней косой черты в URL?

Как я могу извлечь все, что следует за последней косой чертой в URL-адресе в Python? Например, эти URL-адреса должны возвращать следующее:

URL: http://www.test.com/TEST1

returns: TEST1



URL: http://www.test.com/page/TEST2

returns: TEST2



URL: http://www.test.com/page/page/12345

returns: 12345

Я пробовал urlparse, но это дает мне полный путь к файлу, например page/page/12345.

743 10

python url parsing

10 ответов:

Comments

Ничего не найдено.

Luke404 · Accepted Answer · 2015-12-21 06:02:05

вам не нужны причудливые вещи, просто смотрите строковые методы в стандартной библиотеке и вы можете легко разделить свой url-адрес между частью "filename" и остальными:
url.rsplit('/', 1)
таким образом, вы можете получить интересующую вас часть просто с:
url.rsplit('/', 1)[-1]

Kimvais · Accepted Answer · 2011-08-31 10:31:17

еще один(idio (ma)tic) способ:
URL.split("/")[-1]

Benjamin Wohlwend · Accepted Answer · 2011-08-31 10:28:17

rsplit должно быть до задачи:
In [1]: 'http://www.test.com/page/TEST2'.rsplit('/', 1)[1]
Out[1]: 'TEST2'

Jacob Wan · Accepted Answer · 2013-04-04 08:51:03

urlparse отлично подходит для использования, если вы хотите (скажем, чтобы избавиться от любых параметров строки запроса).

import urllib.parse

urls = [
    'http://www.test.com/TEST1',
    'http://www.test.com/page/TEST2',
    'http://www.test.com/page/page/12345',
    'http://www.test.com/page/page/12345?abc=123'
]

for i in urls:
    url_parts = urllib.parse.urlparse(i)
    path_parts = url_parts[2].rpartition('/')
    print('URL: {}\nreturns: {}\n'.format(i, path_parts[2]))

выход:

URL: http://www.test.com/TEST1
returns: TEST1

URL: http://www.test.com/page/TEST2
returns: TEST2

URL: http://www.test.com/page/page/12345
returns: 12345

URL: http://www.test.com/page/page/12345?abc=123
returns: 12345

Winston · Accepted Answer · 2013-09-20 16:53:46

вы можете сделать так:
head, tail = os.path.split(url)
где хвост будет ваше имя файла.

fardjad · Accepted Answer · 2011-08-31 10:28:36

extracted_url = url[url.rfind("/")+1:];

2

2011-08-31 10:28:36

tzot · Accepted Answer · 2011-09-19 12:22:42

partition и rpartition также удобны для таких вещей:
url.rpartition('/')[2]

Old Monk · Accepted Answer · 2017-05-19 12:16:15

разделить url и поп последний элемент url.split('/').pop()

sandoronodi · Accepted Answer · 2018-04-12 17:32:59

вот более общий, регулярное выражение способ сделать это:
    re.sub(r'^.+/([^/]+)$', r'', url)

live_alone · Accepted Answer · 2013-02-19 00:09:10

url ='http://www.test.com/page/TEST2'.split('/')[4]
print url

выход: TEST2.