Шпаргалка Pandas iloc: построчный и постраничный выбор данных

Машинное обучение. Шпаргалка Pandas iloc – выбор данных по позиционным индексам

[Машинное обучение] Шпаргалка Pandas iloc

Построчный и постраничный выбор данных в Pandas

Pandas iloc - это чрезвычайно мощный инструмент для извлечения подмножества строк и столбцов из фрейма данных. Он позволяет выборочно получать доступ к данным по позиционным индексам, что делает его более эффективным и гибким, чем традиционные методы индексации.

Синтаксис

df.iloc[строки, столбцы]

Где:

  • строки - это список, массив, диапазон или отдельные позиции строк для выбора.
  • столбцы - это список, массив, диапазон или отдельные позиции столбцов для выбора.

Примеры

Выбрать несколько строк и столбцов

df.iloc[[0, 2], [1, 3]]

Это выберет строки с индексами 0 и 2, а также столбцы с индексами 1 и 3.

Выбрать диапазон строк и столбцов

df.iloc[1:4, 2:5]

Это выберет строки с индексами от 1 до 3 (не включая 4) и столбцы с индексами от 2 до 4 (не включая 5).

Выбрать все строки и столбцы с конкретными позициями

df.iloc[:, [1, 3]]

Это выберет все строки и столбцы с индексами 1 и 3.

Выбрать строки и столбцы по логическим условиям

df.iloc[df['col1'] > 5, df['col2'] == 'A']

Это выберет строки, для которых значение в столбце 'col1' больше 5, и столбцы, для которых значение в столбце 'col2' равно 'A'.

Особенности

  • iloc работает с целыми числами, индексами и диапазонами индексов.
  • Он индексирует на основе позиции, а не меток.
  • Он может использоваться для выбора строк и столбцов из фреймов данных с любым количеством индексов.
  • Он эффективен для операций с данными с большим объемом данных.

Заключение

Pandas iloc является незаменимым инструментом для выборочного доступа к подмножествам данных в фреймах данных. Это мощный и гибкий метод, который позволяет точно и эффективно извлекать данные на основе индексов строк и столбцов.

To leave a comment you need to Login / Create account