Анализ столбцов

DataFrame не единственный класс в pandas с методом .plot(). Часто встречаемый в pandas объект Series предоставляет похожую функциональность.

Вы можете представить каждый столбец из DataFrame как объект Series. Далее дан пример использования столбца "Median" из структуры DataFrame, созданной на основе данных специальностей колледжей:

median_column = df["Median"]

При наличии объекта Series вы можете создать на его основе новый график. Гистограмма является хорошим способом визуализировать, как значения распределяются по набору данных. Гистограммы разбивают значения на интервалы (bins) и отображают количество данных, чьи значения находятся в определенном интервале. В данном случае гистограмма показывает данные в десяти интервалах от $20,000 до $120,000, и ширина каждого интервала составляет $10,000. Форма гистограммы отличается от нормального распределения, у которого симметричная форма колокола с пиком посередине.

Создадим гистограмму для столбца "Median":

median_column.plot(kind="hist")

Мы вызываем метод .plot() для median_column  и передаем строку "hist" параметру kind.

Полный код примера здесь.