В этой статье мы рассмотрим несколько способов обрезки строк. Будем применять срезы, строковый метод rsplit()
, форматирование и метод shorten()
из модуля textwrap.
Содержание
- Обрезка строки с помощью срезов
- Добавление многоточия после обрезки
- Создание переиспользуемой функции
- Обрезка строки с помощью f-строк
- Обрезка строки с помощью str.rsplit()
- Обрезка строки с помощью textwrap.shorten()
- Обрезка строки с помощью str.format()
Обрезка строки с помощью срезов
Чтобы обрезать строку, можно применить синтаксис срезов, например result = my_str[:5]
. Этот срез возвращает первые пять символов строки.
my_str = 'bobbyhadz.com' result = my_str[:5] print(result) # 👉️ bobby
Синтаксис среза строк следующий: my_str[start:stop:step]
.
Индекс start
является инклюзивным, а индекс stop
— эксклюзивным (символ под индексом start
войдет в итоговый срез, а под индексом stop
— нет).
Индексация в Python начинается с нуля, поэтому первый символ в строке имеет индекс 0, а последний — -1 или len(my_str) - 1
.
my_str = 'bobbyhadz.com' result = my_str[:5] print(result) # 👉️ bobby
В результате мы получили подстроку, содержащую первые пять символов исходной строки.
Добавление многоточия после обрезки
Предположим, вы хотите добавить к результирующей строке троеточие, чтобы показать, что она была обрезана. Но добавлять его нужно, только если строка сократилась по сравнению с исходной. Для этого можно использовать тернарный оператор.
my_str = 'bobbyhadz.com' result = my_str[:5] + '...' if len(my_str) > 5 else my_str print(result) # 👉️ bobby...
Выражение слева от оператора if
(тут — троеточие) возвращается, если условие выполнено, в противном случае строка возвращается как есть.
Создание переиспользуемой функции
Если вам часто приходится обрезать строки, можно создать специальную функцию.
def truncate_string(string, length, suffix='...'): return string[:length] + suffix print(truncate_string('bobbyhadz.com', 3)) # bob... print(truncate_string('bobbyhadz.com', 5)) # bobby... print(truncate_string('bobbyhadz.com', 7)) # bobbyha...
Эта функция принимает в качестве параметров строку, желаемую длину и, по желанию, суффикс и усекает заданную строку до указанной длины.
Обрезка строки при форматировании
Обрезать строку, в том числе при соблюдении определенного условия, можно с помощью f-строк.
my_str = 'bobbyhadz.com' result = f'{my_str:.5}' print(result) # 👉️ bobby result = f'{my_str:.5}{"..." if len(my_str) > 5 else ""}' print(result) # 👉️ bobby...
Обязательно заключайте выражения в фигурные скобки — {expression}
:
var1 = 'bobby' var2 = 'hadz' result = f'{var1}{var2}' print(result) # 👉️ bobbyhadz
F-строки также позволяют нам использовать мини-язык спецификации формата в блоках выражений.
my_str = 'bobbyhadz.com' result = f'{my_str:.5}' print(result) # 👉️ bobby
Цифра после точки — это максимальный размер строки. В этом примере строка форматируется максимум до 5 символов.
Вы можете использовать тернарный оператор для добавления многоточия, если длина строки превышает размер фрагмента.
my_str = 'bobbyhadz.com' result = f'{my_str:.5}{"..." if len(my_str) > 5 else ""}' print(result) # 👉️ bobby...
Обрезка строки с помощью str.rsplit()
Если вам нужно удалить последнее слово из строки, воспользуйтесь методом str.rsplit()
.
my_str = 'bobby hadz com' new_str = my_str.rsplit(' ', 1)[0] print(new_str) # 👉️ 'bobby hadz'
Метод str.rsplit()
возвращает список слов в строке, используя переданный аргумент separator в качестве строки-разделителя.
my_str = 'bobby hadz com' print(my_str.rsplit(' ')) # 👉️ ['bobby', 'hadz', 'com'] print(my_str.rsplit(' ', 1)) # 👉️ ['bobby hadz', 'com']
Метод str.rsplit()
принимает 2 аргумента:
separator
— разделитель, по которому строка разбивается на подстроки. Если не указан, в качестве разделителя используется пробел.maxsplit
— максимальное количество разрезов. Деление строки начинается справа. Это опциональный аргумент.
Если вам нужно удалить из строки 2 последних слова, установите аргумент maxsplit
равным 2 и обратитесь к элементу списка с индексом 0.
my_str = 'bobby hadz com' # 👇️ Удалить последнее слово из строки result = my_str.rsplit(' ', 1)[0] print(result) # 👉️ bobby hadz # 👇️ Удалить 2 последних слова из строки result = my_str.rsplit(' ', 2)[0] print(result) # 👉️ bobby
Обрезка строки с помощью textwrap.shorten()
Чтобы обрезать строку, также можно воспользоваться методом shorten()
из модуля textwrap. Он принимает в качестве параметра строку, максимальную ширину строки и заполнитель.
import textwrap a_string = 'bobby hadz com one two three' new_string = textwrap.shorten(a_string, width=8, placeholder='') print(new_string) # 👉️ bobby new_string = textwrap.shorten(a_string, width=8, placeholder='...') print(new_string) # 👉️ bobby... new_string = textwrap.shorten(a_string, width=15, placeholder='...') print(new_string) # 👉️ bobby hadz...
Метод усекает заданный текст, чтобы он поместился в заданную ширину. Обратите внимание, что заполнитель включается в ширину строки.
import textwrap a_string = 'bobby hadz com one two three' new_string = textwrap.shorten(a_string, width=5, placeholder='...') print(new_string) # 👉️ ...
В этом примере суммарная длина первого слова и заполнителя превышает заданную ширину в пять символов, поэтому возвращается только заполнитель.
Метод textwrap.shorten()
:
- Сокращает пробельные символы (заменяет несколько последовательных пробелов одним пробелом).
- Возвращает строку с сокращенными пробелами, если она укладывается в указанную ширину.
- В противном случае из строки вырезается (с конца) достаточное количество слов, чтобы оставшиеся слова плюс заполнитель поместились в указанную ширину.
Обрезка строки с помощью str.format()
Для обрезки строки также можно использовать метод str.format()
.
a_string = 'bobby hadz com one two three' new_str = '{:.5}'.format(a_string) print(new_str) # 👉️ bobby new_str = '{:.7}'.format(a_string) print(new_str) # 👉️ bobby h new_str = '{:.3}'.format(a_string) print(new_str) # 👉️ bob
Цифра после точки используется для указания количества символов строки, которые нужно вывести.
Метод str.format()
выполняет операции форматирования строк.
first = 'bobby' last = 'hadz' result = "Name: {} {}".format(first, last) print(result) # 👉️ "Name: bobby hadz"
Строка, на которой вызывается метод, может содержать поля замены, указанные с помощью фигурных скобок {}
.
Если использовать еще и тернарный оператор, можно добавить условие обрезки строки.
a_string = 'bobby hadz com one two three' new_str = '{:.5}'.format(a_string) + "..." if len(a_string) > 5 else "" print(new_str) # 👉️ bobby...
Строка в примере содержит более 5 символов, поэтому выполняется оператор if
и в конце добавляется многоточие.
Перевод статьи «How to truncate a String in Python».