Своевременность
Этот набор данных содержит данные из Бюро статистики транспорта.
Создание таблицы
Импорт из сырых данных
Скачивание данных:
Загрузка данных с использованием нескольких потоков:
(если у вас возникнут проблемы с нехваткой памяти или другие проблемы на сервере, уберите часть -P $(nproc)
)
Импорт из сохраненной копии
В качестве альтернативы вы можете импортировать данные из сохраненной копии с помощью следующего запроса:
Снимок был создан 2022-05-29.
Запросы
Q0.
Q1. Количество рейсов в день с 2000 по 2008 год
Q2. Количество рейсов, задержанных более чем на 10 минут, сгруппированных по дням недели, за 2000-2008 годы
Q3. Количество задержек по аэропортам за 2000-2008 годы
Q4. Количество задержек по перевозчику за 2007 год
Q5. Процент задержек по перевозчику за 2007 год
Лучшая версия того же запроса:
Q6. Предыдущий запрос для более широкого диапазона лет, 2000-2008
Лучшая версия того же запроса:
Q7. Процент рейсов, задержанных более чем на 10 минут, по годам
Лучшая версия того же запроса:
Q8. Самые популярные направления по количеству прямо соединенных городов за разные диапазоны лет
Q9.
Q10.
Бонус:
Вы также можете поиграть с данными в Playground, пример.
Этот тест производительности был создан Вадимом Ткаченко. Смотрите:
- https://www.percona.com/blog/2009/10/02/analyzing-air-traffic-performance-with-infobright-and-monetdb/
- https://www.percona.com/blog/2009/10/26/air-traffic-queries-in-luciddb/
- https://www.percona.com/blog/2009/11/02/air-traffic-queries-in-infinidb-early-alpha/
- https://www.percona.com/blog/2014/04/21/using-apache-hadoop-and-impala-together-with-mysql-for-data-analysis/
- https://www.percona.com/blog/2016/01/07/apache-spark-with-air-ontime-performance-data/
- http://nickmakos.blogspot.ru/2012/08/analyzing-air-traffic-performance-with.html