Ищете бесплатные данные для практики своих навыков анализа данных? Вот некоторые из лучших веб-сайтов, на которые стоит обратить внимание.
Независимо от того, проводите ли вы исследование рынка, формируете свое портфолио в качестве аналитика или ищете информацию для расширения охвата рынка, ценные и надежные данные необходимы для принятия обоснованных решений.
Однако поиск в Интернете бесплатных, надежных и доступных данных сопряжен с некоторыми трудностями. Эта статья сделает ваш поиск данных менее сложным, поскольку познакомит вас с некоторыми из лучших веб-сайтов для доступа к бесплатным данным.
Google Trends — это бесплатная служба, разработанная Google, которая предоставляет пользователям нефильтрованные образцы данных поисковых запросов, сделанных в Google. Хотя этот сервис отображает данные временных рядов с 2004 года по настоящее время как в глобальном масштабе, так и на уровне города, он не отображает личные данные пользователей поисковой системы.
Вы также можете ограничить данные, сосредоточив внимание на категориях, языках, объектах или
популярные поисковые запросы в Google с помощью Google Trends. Примеры доступных данных включают: ежедневные поисковые тенденции и тенденции поиска в реальном времени, где показаны данные за последние семь дней.FiveThirtyEight — это веб-сайт журналистики данных, на котором собраны данные об анализе опросов, спорте, поп-культуре, политике, науке и экономических событиях.
Самое замечательное в этом веб-сайте то, что вы можете скачать данные с их веб-сайта или их официальный репозиторий GitHub и используйте свой инструменты визуализации данных для создания захватывающих визуальных эффектов журналистики данных для вашей аудитории. Несколько примеров доступных интересных данных включают прогнозы на чемпионат мира по футболу и Данные прогнозов НХЛ на 2022-23 годы.
BuzzFeed News — это американская платформа последних новостей и оригинальных репортажей, которая сообщает обо всем: от журналистики, технологий, развлечений, новостей о знаменитостях, культуре и самодельных хаках до здравоохранения и политики.
На своем GitHub BuzzFeed News делает свой набор данных, инструменты и анализ из отдела новостей BuzzFeed открытым исходным кодом, доступным и доступным. Пример включает в себя Данные проверки данных ФБР NICS по огнестрельному оружию.
Data.gov — это веб-сайт открытых данных правительства США, на котором размещено более 250 000 общедоступных и хорошо документированных наборов данных от международных и нескольких федеральных правительственных учреждений. Идея этой инициативы заключалась в создании открытого и прозрачного правительства.
Вы можете получить доступ к данным с веб-сайта по теме, агентству или организации. Некоторые примеры данных, которые вы можете найти на Data.gov: национальная система данных по студенческим кредитам и данные о населении электромобилей.
Kaggle — это общедоступная площадка для хранения данных, приобретенная Google, которая предлагает широкий спектр наборов данных по различным темам. Эта общественная платформа позволяет вам делиться своими кодами, учиться, сотрудничать с другими специалистами по данным и повышать квалификацию. Kaggle также проводит соревнования по науке о данных, где вы можете выиграть различные призы.
В этом руководстве содержится руководство для начинающих о том, как начать работу с Kaggle для науки о данных. Примером является Глобальная статистика YouTube за 2023 год.
EarthData — это инициатива НАСА, служащая хранилищем данных о Земле с 1994 года по настоящее время. Вы можете получить данные, связанные с информацией удаленного спутника, с данными об атмосфере, океане и земной гидросфере Земли.
Вы можете просматривать различные темы и получать доступ к таким данным, как данные об экстремальной жаре. Однако вам придется изучить Система планетарных данных НАСА для неземных данных.
IMDb предоставляет данные о фильмах, сериалах, домашнем видео, подкастах, видеоиграх, потоковой информации и контенте знаменитостей. Примером является Некоммерческие наборы данных IMDb.
AWS Public Dataset — это веб-сайт, на котором размещено более 3000 наборов данных, ставших общедоступными через сервисы AWS. Большинство наборов данных здесь основаны на проектах. Некоторые из них включают атлас генома рака и Складные наборы данных о COVID-19.
Inside Airbnb — это наблюдательный веб-сайт, запущенный Мюрреем Коксом. Этот веб-сайт использует общедоступные данные от Эйрбнб, платформа, которая предлагает пользователям недорогие номера по всему миру. Вы можете использовать информацию с этого сайта для проведения аналитики, например аналитика аренды в Монреале.
Google Dataset Search — это поисковая система наборов данных, созданная Google, в которой размещено более 20 миллионов наборов данных. Как и их поисковая система, вы можете получить данные практически из чего угодно. Хорошим примером является Данные канадского национального долгосрочного мониторинга качества воды.
Репозиторий машинного обучения Калифорнийского университета в Ирвине — это хранилище 624 наборов данных для сообщества машинного обучения со всего мира. Этот веб-сайт имеет хорошую репутацию в сообществе, поскольку наборы данных классифицируются в зависимости от задач машинного обучения, для которых они подходят. Примером является Набор данных Iris, известный набор данных модели классификации и кластеризации.
Datahub как платформа имеет множество наборов данных, которые охватывают широкий спектр тем, таких как Доходность по 10-летним государственным облигациям США (долгосрочная процентная ставка). Помимо данных, они также отображают инструменты обработки данных и наборы инструментов, которые могут пригодиться специалистам по данным.
Это первый веб-сайт в нашем списке, на котором представлены эксклюзивные данные о здоровье. Глобальная обсерватория здравоохранения служит хранилищем данных, отображающих статистику здравоохранения по более чем 1000 показателям для 194 государств-членов ВОЗ. Данные записываются для мониторинга прогресса этих государств-членов в достижении целей ЦУР. Вы можете получить данные, отфильтровав тему, категорию, метаданные и индикатор данных.
Эта платформа действительно нишевая. Он показывает данные исследований и информацию о рынке, такую как Кассовые сборы выходного дня и соответствующие данные о киноиндустрии Великобритании.
GitHub — это больше, чем просто дом для миллионов совместных проектов с открытым исходным кодом. На платформе также размещено множество репозиториев, предназначенных для хранения бесплатных, общедоступных наборов данных с открытым исходным кодом. Даже У BuzzFeedNews есть репозиторий GitHub с открытым исходным кодом..
Другими примерами являются Потрясающий репозиторий общедоступных наборов данных и ты вообще поднимаешь набор данных. Вы также можете внести свой вклад в эти проекты с открытым исходным кодом на GitHub.
Data.world — это сообщество данных и платформа для совместной работы, на которой размещаются проекты и наборы данных. Хотя некоторые наборы данных являются платными, большая часть данных на платформе, например Makeover Monday's 2021/W16: ежемесячные авиапассажиры в Америке, бесплатны и их можно легко загрузить локально или получить доступ через их API.
Открытые данные Всемирного банка — это каталог данных глобальной экономики и развития. Вы можете просматривать и фильтровать данные, например глобальная статистика стоимости и доступности здорового питания по показателю и стране.
Nasdaq Data Link предназначен для всех финансовых, экономических и альтернативных данных. Вы можете получить доступ к таким данным, как Публикация данных Федеральной резервной системы США через электронную таблицу, например Excel, или API.
Платформа данных Комиссии по такси и лимузинам Нью-Йорка записывает и размещает такую информацию, как Рекорды поездок на желтом и зеленом такси по Нью-Йорку. Самое замечательное в этом веб-сайте то, что он показывает информацию обо всем: от места посадки/высадки до зоны такси и стоимости поездки.
Academic Torrents — это каталог исследовательских данных объемом более 127,15 ТБ. Он был построен, что называется, для исследователей и исследователями.
Исследуйте и учитесь
Надеемся, что с помощью этого списка вы сможете получить данные, которые смогут сформировать ваш бизнес-ландшафт, стимулировать ваши исследования рынка, получить конкурентное преимущество и помочь вам бесплатно создать этот уникальный портфель данных. Так что используйте возможности, исследуйте и займитесь менее сложным поиском данных.