Pandas - это мощная библиотека для анализа и манипулирования данными в Python. Для многих ролей, связанных с наукой о данных, хорошее понимание Pandas является обязательным требованием. В этой статье мы рассмотрим некоторые распространенные вопросы, которые могут быть заданы на собеседовании по Pandas, чтобы помочь вам подготовиться к собеседованию.
Объясните концепцию фрейма данных Pandas.
Что такое индекс в Pandas?
Как создать фрейм данных из списка словарей?
pandas.DataFrame()
, передав список словарей в качестве параметра.Как отфильтровать строки из фрейма данных на основе нескольких условий?
query()
для фильтрации строк на основе нескольких условий. Синтаксис: df.query("условие1 & условие2")
.Как объединить два фрейма данных по общему столбцу?
merge()
для объединения двух фреймов данных на основе общего столбца. Синтаксис: pd.merge(df1, df2, on="общий столбец")
.Как изменить тип данных столбца фрейма данных?
astype()
для изменения типа данных столбца. Синтаксис: df["столбец"] = df["столбец"].astype("тип данных")
.Как вычислить среднее значение для каждой группы во фрейме данных?
groupby()
и функцию mean()
для вычисления среднего значения для каждой группы. Синтаксис: df.groupby("группа")["столбец"].mean()
.Как найти уникальные значения в столбце фрейма данных?
unique()
для поиска уникальных значений в столбце. Синтаксис: df["столбец"].unique()
.Как создать сводную таблицу из фрейма данных?
pivot_table()
для создания сводной таблицы из фрейма данных. Синтаксис: df.pivot_table(index="столбец_индекса", columns="столбец_группировки", values="столбец_значений", aggfunc="функция агрегации")
.Объясните разницу между Series и DataFrame.
Что такое иерархический индекс в Pandas?
Как обработать пропущенные значения во фрейме данных?
isnull()
и fillna()
. isnull()
возвращает массив булевых значений, указывающих, какие значения пропущены, а fillna()
заполняет пропущенные значения указанным значением.Эти вопросы являются лишь небольшим фрагментом вопросов, которые могут быть заданы на собеседовании по Pandas. Чтобы добиться успеха на собеседовании, рекомендуется практиковаться в использовании Pandas, работать над реальными проектами и изучать сопутствующую документацию.