Автор: CoolPython
Set’ ы в Python реализованы так, что максимально напоминают математические множества. Давайте пройдемся по основным свойствам и возможностям множеств в Python, и разберемся, как их использовать.
В математике множество — это набор объектов произвольной природы. В Python множество тоже может содержать переменные разных типов, например:
>>> A = {"My hovercraft is full of eels", 42, (3.14, 2.72)}
Но есть одно ограничение: элементы множества должны быть хэшируемыми: например, в множество можно добавить строки, числа и кортежи, но нельзя словари и списки:
>>> A.add([-1, 0]) TypeError: unhashable type: 'list'
При этом поскольку сами множества мутабельны, то множество множеств, как в известном парадоксе про брадобрея, сделать не получится. Но если очень хочется, можно использовать frozenset’ы: эти объекты в остальном ведут себя почти так же, но они иммутабельны и их можно добавить в множество.
Инициализировать множество можно используя фигурные скобки или через конструктор класса set(). Эти инициализации эквивалентны:
>>> B = {1, 2, 3} >>> B = set((1, 2, 3))
Только не запутайтесь: такая инструкция
C = {}
создаст не множество, а словарь.
В версиях интерпретатора 2.7 и выше работают set comprehensions:
>>> C = {x for x in range(1, 5)} >>> C {1, 2, 3, 4}
Элементы множества, как и в математике, должны быть уникальными. На практике этим пользуются для того, чтобы исключить повторяющиеся элементы:
>>> D = [1, 2, 3, 3] >>> D = list(set(D)) >>> D [1, 2, 3]
Кстати, множества не сохраняют порядок, поэтому если он нужен, то добро пожаловать в списки. Из-за того, что порядка нет, во множествах нет ни индексирования, ни слайсов. В то же время циклы по множеству можно делать обычным pythonic-способом:
>>> for elem in C: ... print(elem)
Над множествами в Python можно делать те же операции, что и в математике: находить объединение, пересечение, проверять принадлежность к множеству и так далее. Для этого можно пользоваться операторами, а можно методами множеств:
A | B A.union(B) A & B A.intersection(B) A - B A.difference(B) A <= B A.issubset(B) A => B A.issuperset(B) …
Обратите внимание, что операторы принимают только set’ы, а методы — любые iterable контейнеры. Есть мнение, что операторы менее читаемые, но оба подхода в целом равноправны.
И еще у класса set есть методы, которые удобны для работы со множествами как с коллекциями:
add()
— добавить элемент,remove()
— удалить элемент,pop()
— извлечь с удалением,update()
— объединить с другим множеством,clear()
— очистить множество.
И напоследок: один раз я больно отстрелила себе ногу, когда хотела добавить составной элемент в множество с помощью неправильного инструмента. Например, если у нас есть множество строк и мы пытаемся добавить в него еще один элемент вот так:
>>> F = {"Seregia", "Vasia"} >>> F.update("Alisa")
то получаем ожидаемый результат:
>>> F {'l', 'a', 'Seregia', 'Vasia', 'A', 'i', 's'}
Это абсолютно валидный код и он отработает, поэтому такую ошибку по невнимательности можно искать довольно долго. Так что не попадайте в ловушку методов add()
и update()
.
В общем, Python set’ы сильно напоминают математические множества: могут содержать объекты разных типов, требуют уникальности элементов, не сохраняют порядок и имеют методы, позволяющие их объединять, пересекать, etc… Кроме того, множества имеют интерфейс для работы с ними как с коллекциями.
Как определиться в выборе коллекции?
- Если важен порядок — используйте списки.
- Если нужно отображение ключ-значение — используйте словари.
- Если нужен набор уникальных элементов — используйте множества.