Перевод статьи «How to Read YAML File in Python».
YAML расшифровывается как Yet Another Mark-up Language, что означает «Еще один язык разметки». Этот формат файлов сейчас очень популярен для хранения сериализованных данных, которые достаточно удобочитаемы для человека.
Такой формат в основном используется для файлов конфигурации, но может применяться и для других целей. Содержимым такого файла могут быть различные типы скалярных данных, например число, строка и т.д. Так же это могут быть составные данные, такие как список или словарь. Расширение YAML-файлов – .yaml
.
В Python есть несколько модулей для чтения файлов YAML. Сегодня мы поговорим о том, как читать файлы YAML в Python, а точнее — покажем, как это делается при помощи модуля PyYAML.
Для начала
Конечно же, прежде чем решать какие-либо задачи, нужно установить модуль PyYAML. Это, пожалуй, лучший модуль Python для чтения файлов YAML. Однако он не устанавливается вместе с Python по умолчанию. Поэтому, прежде чем проверять примеры, которые мы разберем ниже, вам придется его установить.
Чтобы установить PyYAML, выполните следующую команду:
pip install pyyaml
Создание файла YAML
Для дальнейшей работы нам понадобится файл с содержимым, как в примере ниже. Создайте его и назовите client.yaml.
- name: Kamal Hossain email: kamal@gmail.com mobile: 01843456790 - name: Sakil Ahamed email: sakil@gmail.com mobile: 015662343423 - name: Mizanur Rahman email: mizan@gmail.com mobile: 01936784534
Пример 1. Чтение содержимого YAML после преобразования объекта Python
После установки пакета PyYAML модуль YAML можно импортировать в скрипт для чтения содержимого YAML путем преобразования объекта Python.
Для создания содержимого YAML (путем сериализации содержимого объекта Python) используется функция dump()
модуля yaml.
Давайте напишем код для генерации и вывода в консоль потока YAML путем преобразования содержимого объекта Python. По умолчанию функция dump()
сортирует содержимое словаря на основе ключей.
import yaml # Declare a python object with data books = [{'name': 'Think Python: An Introduction to Software Design', 'author': 'Allen B. Downey', 'price': '23'}, {'name': 'Fluent Python: Clear, Concise, and Effective Programming', 'author': 'Luciano Ramalho', 'price': '50'}, {'name': 'Think Python: An Introduction to Software Design', 'author': 'Allen B. Downey', 'price': '33'} ] # Convert and print the JSON data in YAML stream print(yaml.dump(books))
После запуска кода мы получим следующий результат:
- author: Allen B. Downey name: 'Think Python: An Introduction to Software Design' price: '23' - author: Luciano Ramalho name: 'Fluent Python: Clear, Concise, and Effective Programming' price: '50' - author: Allen B. Downey name: 'Think Python: An Introduction to Software Design' price: '33'
Элементы всех словарей списка Python преобразованы в элементы содержимого YAML. При этом вывод отсортирован по ключам словаря. Поэтому значение ключа author
было выведено первым, а значение ключа price
– последним.
Пример 2. Чтение содержимого из файла YAML
В данном примере мы будем использовать файл client.yaml, созданный ранее.
Напишем следующий код для чтения отсортированного на основе ключей содержимого файла client.yaml .
Функция load()
используется для чтения полного содержимого нашего файла. Эта функция вернет содержимое файла в виде списка словарей Python. Затем функция dump()
преобразует список в поток YAML, который мы после выведем в консоль.
# Import YAML module import yaml # Load YAML data from the file with open('client.yaml') as fh: read_data = yaml.load(fh, Loader=yaml.FullLoader) # Print YAML data before sorting print(read_data) # Sort YAML data based on keys sorted_data = yaml.dump(read_data) # Print YAML data after sorting print(sorted_data)
При запуске этого кода получим следующий вывод:
[{'name': 'Kamal Hossain', 'email': 'kamal@gmail.com', 'mobile': '01843456790'}, {'name': 'Sakil Ahamed', 'email': 'sakil@gmail.com', 'mobile': 1858717459}, {'name': 'Mizanur Rahman', 'email': 'mizan@gmail.com', 'mobile': '01936784534'}] - email: kamal@gmail.com mobile: 01843456790 name: Kamal Hossain - email: sakil@gmail.com mobile: 1858717459 name: Sakil Ahamed - email: mizan@gmail.com mobile: 01936784534 name: Mizanur Rahman
После преобразования содержимого файла client.yaml в список словарей Python каждый словарь был преобразован в элемент YAML-контента, как и в предыдущем примере. Значение параметра sort_key
функции dump()
по умолчанию — True
. Поэтому в выводе мы видим контент YAML, отсортированный по ключам.
Пример 3. Чтение ключей и значений из файла YAML
Давайте напишем код для чтения и вывода ключей и значений из файла client.yaml по отдельности. После загрузки содержимого файла в переменную read_data
используем функцию item()
для чтения каждого ключа и соответствующего значения. Для перебора всего содержимого файла и вывода в консоль пар «ключ-значение» воспользуемся вложенным циклом for
.
# Import YAML module import yaml # Load the YAML file with open('client.yaml') as fh: # Load YAML data from the file read_data = yaml.load(fh, Loader=yaml.FullLoader) # Iterate the loop to read and print YAML data for i in range(0, len(read_data)): for key, value in read_data[i].items(): print(key, ":", value) print('')
Вывод:
name : Kamal Hossain email : kamal@gmail.com mobile : 01843456790 name : Sakil Ahamed email : sakil@gmail.com mobile : 1858717459 name : Mizanur Rahman email : mizan@gmail.com mobile : 01936784534
Обратите внимание, что содержимое файла не отсортировано, поскольку мы не использовали функцию dump()
.
Пример 4. Чтение содержимого YAML-файла в список словарей
Функция safe_load()
используется для преобразования содержимого файла YAML в список словарей Python. Эту функцию также можно использовать для загрузки данных из ненадежных источников.
Давайте напишем код для загрузки содержимого файла YAML (с помощью функции safe_load()
) и вывода загруженного содержимого в консоль.
# Import YAML module import yaml # Load the YAML file with open('client.yaml') as fh: # Convert the YAML data into a dictionary dictionary_data = yaml.safe_load(fh) # Print the dictionary data print(dictionary_data)
В выводе получаем список словарей:
[{'name': 'Kamal Hossain', 'email': 'kamal@gmail.com', 'mobile': '01843456790'}, {'name': 'Sakil Ahamed', 'email': 'sakil@gmail.com', 'mobile': 1858717459}, {'name': 'Mizanur Rahman', 'email': 'mizan@gmail.com', 'mobile': '01936784534'}]
Заключение
В этой статье мы на нескольких примерах разобрали, как читать файлы YAML в Python. Конечно, с практикой придёт большее понимание, как работать с библиотекой PyYAML. А сейчас можно запустить код из примеров, которые мы привели выше, и удостовериться, что тема чтения файлов YAML полностью понятна.