Python Библиотеки. Джейд Картер. Читать онлайн. Newlib. NEWLIB.NET

Автор: Джейд Картер
Издательство: Автор
Серия:
Жанр произведения:
Год издания: 2024
isbn:
Скачать книгу
Структура табличных данных: DataFrame представляет из себя таблицу с данными, где каждая строка представляет собой отдельную запись, а каждый столбец – различные атрибуты (поля) этих записей.

      2. Метки по осям: В DataFrame метки по осям позволяют легко идентифицировать данные. Оси DataFrame имеют метки строк (индексы) и столбцов.

      3. Разнообразные типы данных: В DataFrame можно хранить данные различных типов, включая числа, строки, временные метки и другие.

      4. Гибкость в обработке данных: Pandas предоставляет обширный набор методов и функций для фильтрации, сортировки, группировки, объединения и агрегации данных в DataFrame.

      Пример создания простого DataFrame:

      ```python

      import pandas as pd

      data = {'Имя': ['Анна', 'Борис', 'Виктория'],

      'Возраст': [25, 30, 22],

      'Город': ['Москва', 'Санкт-Петербург', 'Киев']}

      df = pd.DataFrame(data)

      print(df)

      ```

      Этот пример создает DataFrame из словаря, где ключи словаря становятся названиями столбцов, а значения – данными в столбцах. Созданный DataFrame будет выглядеть следующим образом:

      ```

      Имя Возраст Город

      0 Анна 25 Москва

      1 Борис 30 Санкт-Петербург

      2 Виктория 22 Киев

      ```

      DataFrame в Pandas является важным инструментом для анализа и обработки данных, и он широко используется в областях работы с данными, машинного обучения, статистики и других.

      Из списка словарей:

      ```python

      import pandas as pd

      data = {'Имя': ['Анна', 'Борис', 'Виктория'],

      'Возраст': [25, 30, 22],

      'Город': ['Москва', 'Санкт-Петербург', 'Киев']}

      df = pd.DataFrame(data)

      print(df)

      ```

      Из CSV-файла:

      ```python

      import pandas as pd

      df = pd.read_csv('данные.csv')

      print(df)

      ```

      CSV (Comma-Separated Values) – это текстовый формат для представления табличных данных. В файле CSV данные организованы в виде таблицы, где каждая строка представляет собой отдельную запись, а столбцы разделены разделителем, обычно запятой (`,`). Однако, в зависимости от локали, могут использоваться и другие разделители, такие как точка с запятой (`;`) или табуляция (`\t`).

      CSV-файлы позволяют эффективно хранить и передавать табличные данные между программами. Этот формат широко используется в области обработки данных, анализа данных, а также в различных приложениях для импорта и экспорта информации в табличной форме.

      Пример CSV-файла:

      Имя,Возраст,Город

      Анна,25,Москва

      Борис,30,Санкт-Петербург

      Виктория,22,Киев

      В этом примере каждая строка представляет собой запись с именем, возрастом и городом. Значения разделены запятыми, что является стандартным подходом, но можно использовать и другие разделители.

      CSV-файлы легко читаются и создаются с использованием различных программ, включая текстовые редакторы, электронные таблицы (например, Microsoft Excel, Google Sheets) и программы для обработки данных (например, Python с библиотекой Pandas).

      3. Основные операции с DataFrame

      Просмотр данных:

      ```python

      # Вывести первые n строк DataFrame

      print(df.head())

      # Вывести последние n строк DataFrame

      print(df.tail())

      ```

      Индексация