3-40 ДНЕЙ С ВАШЕЙ ЛЮБИМОЙ PYTHON-БИБЛИОТЕКОЙ: PANDAS - РУКОВОДСТВО ДЛЯ НАЧИНАЮЩИХ

"3-40 дней с Pandas: библиотека для работы с данными, анализа и машинного обучения"

3-40 ДНЕЙ С ВАШЕЙ ЛЮБИМОЙ PYTHON-БИБЛИОТЕКОЙ: PANDAS

PANDAS - это библиотека, которая предоставляет конструкции данных и операции для работы с структурированными данными. Она используется в таких областях, как анализ данных, машинное обучение и обработка данных. В этой серии статей мы подробно рассмотрим Pandas, включая ее структуры данных, операции, методы и практические примеры.

День 1: Введение в Pandas

  • Что такое Pandas?
    • Библиотека для работы со структурированными данными в Python
  • Структуры данных Pandas:
    • Pandas DataFrame: двумерная структура данных, аналогичная таблице
    • Pandas Series: одномерный массив меченных данных
  • Установка Pandas:
    • pip install pandas

День 2: Создание и инициализация DataFrame

  • Создание DataFrame из словаря:
    • {column_name1: [values1], column_name2: [values2], ...}
  • Создание DataFrame из списка словарей:
    • [{'column_name1': value1, 'column_name2': value2, ...}, ...]
  • Создание DataFrame из DataFrame:
    • new_df = existing_df.copy()

День 3: Типы данных столбцов DataFrame

  • Получение типов данных столбцов:
    • df.dtypes
  • Изменение типов данных столбцов:
    • df[column_name].astype(new_dtype)

День 4: Доступ к элементам DataFrame

  • Доступ к элементу по индексу:
    • df.loc[row_index, column_name]
  • Доступ к строке по индексу:
    • df.iloc[row_index]
  • Доступ к столбцу по имени:
    • df[column_name]

День 5: Добавление и удаление столбцов и строк

  • Добавление столбца:
    • df[new_column_name] = new_values
  • Удаление столбца:
    • df.drop(column_name, axis=1, inplace=True)
  • Добавление строки:
    • df.loc[new_index] = new_values
  • Удаление строки:
    • df.drop(row_index, inplace=True)

День 6: Слияние и объединение DataFrame

  • Слияние DataFrame по столбцу:
    • merged_df = pd.merge(df1, df2, on='column_name')
  • Объединение DataFrame по строкам:
    • concat_df = pd.concat([df1, df2], axis=0)

День 7: Сортировка и фильтрация DataFrame

  • Сортировка DataFrame:
    • sorted_df = df.sort_values(by='column_name')
  • Фильтрация DataFrame:
    • filtered_df = df[(df['column_name'] > value) & (df['column_name2'] < value2)]

День 8: Агрегатные функции для DataFrame

  • Агрегатные функции:
    • mean(), sum(), max(), min(), std()
  • Применении агрегатных функций:
    • df.groupby('column_name').agg({'column_name2': 'max'})

День 9: Работа с индексами DataFrame

  • Получение индексов DataFrame:
    • df.index
  • Установка индексов DataFrame:
    • df.set_index('column_name')

День 10: Обработка пропущенных значений в DataFrame

  • Проверка на наличие пропущенных значений:
    • df.isnull()
  • Заполнение пропущенных значений нулями:
    • df.fillna(0)
  • Заполнение пропущенных значений средним значением:
    • df.fillna(df.mean())

И так далее...

Продолжайте следить за нашей серией, чтобы узнать больше о Pandas и о том, как эффективно ее использовать.

To leave a comment you need to Login / Create account