{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Домашнее задание №4\n", "\n", "Все данные располагаются в [папке](https://drive.google.com/drive/folders/1lqLoYRrMXrKQiSzCKyI8ZWXRbQWnA9K9?usp=sharing). \n", "\n", "## Звёзды\n", "\n", "В таблице [stars.csv](https://drive.google.com/file/d/1vd2mGx9LwvccLz6GuBbcL9eQ1E0KEjqv/view?usp=sharing) содержится информация о 240 звёзд. \n", "\n", "- `Temperature (K)` --- температура в Кельвинах;\n", "- `Luminosity(L/Lo)` --- [cветимость](https://ru.wikipedia.org/wiki/%D0%A1%D0%B2%D0%B5%D1%82%D0%B8%D0%BC%D0%BE%D1%81%D1%82%D1%8C) звезды относительно [солнечной светимости](https://ru.wikipedia.org/wiki/%D0%A1%D0%BE%D0%BB%D0%BD%D0%B5%D1%87%D0%BD%D0%B0%D1%8F_%D1%81%D0%B2%D0%B5%D1%82%D0%B8%D0%BC%D0%BE%D1%81%D1%82%D1%8C) $L_\\odot = 3.828 \\times 10^{26}$ Вт;\n", "- `Radius(R/Ro)` --- радиус звезды по отношению к радиусу солнца $R_\\odot = 6.9551 \\times 10^8$ м;\n", "- `Absolute magnitude(Mv)` --- [абсолютная звёздная величина](https://ru.wikipedia.org/wiki/%D0%90%D0%B1%D1%81%D0%BE%D0%BB%D1%8E%D1%82%D0%BD%D0%B0%D1%8F_%D0%B7%D0%B2%D1%91%D0%B7%D0%B4%D0%BD%D0%B0%D1%8F_%D0%B2%D0%B5%D0%BB%D0%B8%D1%87%D0%B8%D0%BD%D0%B0);\n", "- `Star color` --- цвет звезды;\n", "- `Star type` --- тип звезды, число от 0 до 5, где \n", " - 0 --- [Red Dwarf](https://ru.wikipedia.org/wiki/%D0%9A%D1%80%D0%B0%D1%81%D0%BD%D1%8B%D0%B9_%D0%BA%D0%B0%D1%80%D0%BB%D0%B8%D0%BA), \n", " - 1 --- [Brown Dwarf](https://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D1%80%D0%B8%D1%87%D0%BD%D0%B5%D0%B2%D1%8B%D0%B9_%D0%BA%D0%B0%D1%80%D0%BB%D0%B8%D0%BA), \n", " - 2 --- [White Dwarf](https://ru.wikipedia.org/wiki/%D0%91%D0%B5%D0%BB%D1%8B%D0%B9_%D0%BA%D0%B0%D1%80%D0%BB%D0%B8%D0%BA), \n", " - 3 --- [Main Sequence](https://ru.wikipedia.org/wiki/%D0%93%D0%BB%D0%B0%D0%B2%D0%BD%D0%B0%D1%8F_%D0%BF%D0%BE%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D0%BE%D1%81%D1%82%D1%8C), \n", " - 4 --- [Super Giants](https://ru.wikipedia.org/wiki/%D0%A1%D0%B2%D0%B5%D1%80%D1%85%D0%B3%D0%B8%D0%B3%D0%B0%D0%BD%D1%82), \n", " - 5 --- [Hyper Giants](https://ru.wikipedia.org/wiki/%D0%93%D0%B8%D0%BF%D0%B5%D1%80%D0%B3%D0%B8%D0%B3%D0%B0%D0%BD%D1%82);\n", "- `Spectral Class` --- [спектральный класс](https://ru.wikipedia.org/wiki/%D0%A1%D0%BF%D0%B5%D0%BA%D1%82%D1%80%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D1%8F_%D0%B7%D0%B2%D1%91%D0%B7%D0%B4) звезды (один из `O`, `B`, `A`, `F`, `G`, `K` и `M`).\n", "\n", "\n", "Задание:\n", "1. обработать значения в столбце с цветом: привести значения в этом столбце к общему виду (в частности, значения 'Blue white', 'Blue White' и 'Blue-white` должны совпадать;\n", "2. добавить столбец, в котором тип звезды указан полной строкой, а не числом;\n", "3. для столбца со спектральным классом, наоборот, добавить столбец с числами, в следующем соответствии: \n", " - `O` $\\to$ 0, \n", " - `B` $\\to$ 1, \n", " - `A` $\\to$ 2, \n", " - `F` $\\to$ 3, \n", " - `G` $\\to$ 4, \n", " - `K` $\\to$ 5, \n", " - `M` $\\to$ 6;\n", "4. посчитать количество звезд каждого цвета, каждого типа и каждого спектрального класса;\n", "5. среди звезд каждого типа найти минимальные, средние и максимальные значения абсолютной звездной величины;\n", "6. среди звезд каждого класса найти минимальные, средние и максимальные значения температуры;\n", "7. вычислить попарные корреляции между всеми числовыми столбцами;" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Солнечные пятна\n", "\n", "В таблице [sunspot.csv](https://drive.google.com/file/d/1X4bZiMjHepHpBtV-DoXpDVYJTJfHBIT6/view?usp=sharing) содержит данные о наблюдениях солнечных пятен с 1818 года. \n", "\n", "- `year` --- год наблюдения;\n", "- `month` --- месяц наблюдения;\n", "- `day` --- день наблюдения;\n", "- `Number of spots` --- суммарное количество солнечных пятен, замеченных в этот день. В столбце приводится среднее значение, если есть данные о наблюдениях от разных обсерваторий. Если данных за этот день нет, то в столбце ставится значение `-1`;\n", "- `Standard Deviation` --- среднеквадратическое отклонение наблюдений с разных станций; Если данных за этот день нет, то в столбце ставится значение `-1`;\n", "- `Observations` --- количество станций, доложивших наблюдения за этот день;\n", "\n", "Задание:\n", "1. Скомбинировать первые три столбца в столбец с полной датой типа `datetime`;\n", "2. Заменить все `-1`, соответствующие отсутствующим значениям, на `np.nan` (или сделать это ещё на этапе чтения таблицы);\n", "3. Для каждого года вычислить суммарное количество следующих величин:\n", " - количество дней, за которое присутствуют данные;\n", " - суммарное количество пятен;\n", "4. Построить графики этих величин;\n", "5. На основе данных только за 21 век вычислить среднее количество пятен в месяц и построить [столбчатую диаграмму](https://ru.wikipedia.org/wiki/%D0%A1%D1%82%D0%BE%D0%BB%D0%B1%D1%87%D0%B0%D1%82%D0%B0%D1%8F_%D0%B4%D0%B8%D0%B0%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0) (barplot, barchart). " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Баскетболисты NBA\n", "\n", "В таблице [NBA.csv](https://drive.google.com/file/d/1VS_u99V73cEuGWppqEdvnyluT8ebth8U/view?usp=sharing) находятся физиологические данные 4550 баскетболистов [NBA](https://ru.wikipedia.org/wiki/%D0%9D%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D0%B1%D0%B0%D1%81%D0%BA%D0%B5%D1%82%D0%B1%D0%BE%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D0%B0%D1%81%D1%81%D0%BE%D1%86%D0%B8%D0%B0%D1%86%D0%B8%D1%8F), собранные в период с 1947 по 2017. \n", "\n", "- `Player Full Name` --- имя баскетболиста;\n", "- `Birth Date` --- дата рождения;\n", "- `Year Start` --- год начала карьеры;\n", "- `Year End` --- год завершения карьеры;\n", "- `Position` --- позиция игрока:\n", " - `F` --- нападающий;\n", " - `G` --- защитник;\n", " - `C` --- центровой;\n", " - `G-F` --- на протяжении карьеры выступал и на позиции защитника и на позиции нападающего;\n", " - `F-C` --- на протяжении карьеры выступал и на позиции нападающего и на позиции центрового;\n", "- `Height` --- рост в сантиметрах;\n", "- `Wingspan` --- размах рук в сантиметрах;\n", "- `Weight` --- вес в фунтах (0.45359237 кг);\n", "\n", "Задание:\n", "1. перевести вес в килограммы;\n", "2. найти самого высокого и самого низкого игрока;\n", "3. найти самого легкого и тяжелого игрока;\n", "4. найти игроков с самым маленьким и самым большим размахом рук;\n", "5. найти корреляции между столбцами с ростом, весом и размахом рук; построить [диаграмму рассеяния](https://ru.wikipedia.org/wiki/%D0%94%D0%B8%D0%B0%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0_%D1%80%D0%B0%D1%81%D1%81%D0%B5%D1%8F%D0%BD%D0%B8%D1%8F) (scatter plot) для этих показателей (опционально, если знакомы с линейной регрессией и инструментами для её вычисления в `python`, можно добавить график линейной регрессии);\n", "6. добавить столбец с продолжительностью карьеры;\n", "7. добавить столбец с [индексом массы тела](https://ru.wikipedia.org/wiki/%D0%98%D0%BD%D0%B4%D0%B5%D0%BA%D1%81_%D0%BC%D0%B0%D1%81%D1%81%D1%8B_%D1%82%D0%B5%D0%BB%D0%B0);\n", "8. исследовать, как зависят средняя продолжительность карьеры, средний рост, средний вес и средний размах рук в зависимости от позиции (построить графики);\n", "9. исследовать, как меняются те же самые показатели с течением времени (построить графики);\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [] } ], "metadata": { "language_info": { "name": "python" }, "orig_nbformat": 4 }, "nbformat": 4, "nbformat_minor": 2 }