データ分析 コンペサイトに参加して腕を上げる方法

コンペ
この記事は約5分で読めます。

データ分析は、日進月歩。次々と新しい手法が生み出され数年後にはさらに効率化され、
精度が上がっていきます。世界のトレンドを把握することでデータサイエンティストとしての腕を上げていきます。

コンペサイトの紹介

コンペとは、とある機関からデータセットが提供され、世界中のデータサイエンティストがより高いスコアを出すための手法を導き出し、競い合います。
コードが公開されることも多く、解き方を学習したり、新たなアルゴリズムの学習に利用できます。

kaggle

Googleが買収したkaggleです、最も参加者が多いサイトで有名です。

Kaggle: Your Machine Learning and Data Science Community
Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.

最近新型コロナウィルス感染症(COVID-19)のデータが公開されました。
https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

参加してみてはいかがでしょうか。

コースの受講

kaggleでは入門者向けのコースが受講でき、上から順に取り組むとデータサイエンティストとしての技術を身に付けることができます。

Python

データサイエンスでもっと重要なプログラミング言語Pythonを学習します。

Learn Python Tutorials
Learn the most important language for data science.

機械学習の紹介

機械学習のコアアイディアを学び、最初のモデルを作成して機械学習を学びます。

Learn Intro to Machine Learning Tutorials
Learn the core ideas in machine learning, and build your first models.

機械学習、中級編

欠損値、非数値、Leakageなどの処理方法を学びます。モデルはより正確で便利になります。

Learn Intermediate Machine Learning Tutorials
Learn to handle missing values, non-numeric values, data leakage and more. Your models will be more accurate and useful.

Pandas

PythonのデータフレームライブラリPandasについて学習します。

Learn Pandas Tutorials
Solve short hands-on challenges to perfect your data manipulation skills.

Feature Engineering(機能エンジニアリング)

モデルを最適化する方法、機能エンジニアリングを学びます。

Learn Feature Engineering Tutorials
Discover the most effective way to improve your models.

Data Visualization(データの可視化)

優れたデータ視覚化を行います。コーディングの力を見るのに最適な方法です!

Learn Data Visualization Tutorials
Make great data visualizations. A great way to see the power of coding!

Deep Learning(ディープラーニング)

TensorFlowを使用して、機械学習を次のレベルに引き上げます。あなたの新しいスキルはあなたを驚かせるでしょう。

Learn Deep Learning Tutorials
Use TensorFlow to take machine learning to the next level. Your new skills will amaze you.

Intro to SQL(SQLの概要)

Google BigQueryを使用して大規模なデータセットに拡張する、データベースを操作するためのSQLについて学びます。

Learn Intro to SQL Tutorials
Learn SQL for working with databases, using Google BigQuery to scale to massive datasets.

Advanced SQL(高度なSQL)

SQLのレベルを次のレベルに引き上げます。

Learn Advanced SQL Tutorials
Take your SQL skills to the next level.

Geospatial Analysis(地理空間分析)

インタラクティブなマップを作成し、地理空間データのパターンを発見します。

Learn Geospatial Analysis Tutorials
Create interactive maps, and discover patterns in geospatial data.

Microchallenges(マイクロチャレンジ)

非常に短い課題を解くことで、これまで学習してきたスキルのテストをします。

Learn Microchallenges Tutorials
Solve ultra-short challenges to build and test your skill.

Machine Learning Explainability(機械学習の説明可能性)

機械学習モデルから人間が理解できる洞察を抽出します。

Learn Machine Learning Explainability Tutorials
Extract human-understandable insights from any machine learning model.

Natural Language Processing(自然言語処理)

テキストデータを操作する方法を学習して、テキストを分類しましょう。

Learn Natural Language Processing Tutorials
Distinguish yourself by learning to work with text data.

Intro to Game AI and Reinforcement Learning(ゲームAIと強化学習の概要)

古典的なアルゴリズムと最先端の技術を使用して、独自のビデオゲームBOTを構築します。

Learn Intro to Game AI and Reinforcement Learning Tutorials
Build your own video game bots, using classic algorithms and cutting-edge techniques.

SIGNATE

和製kaggleです。日本の行政、機関、企業がデータセットを公開し、順位を競います。
上位入賞には賞金が与えられます。海外からの参加者も目立ちます。
海上の氷面積の計算や、自動車走行画像の解析や、賃貸価格の予想モデルの作成、JTのタバコ商品の分別など実用的なコンペがたくさん開催されています。

https://signate.jp/competitions

こちらでも新型コロナウィルス感染症(COVID-19)のコンペティションが開催されています。

COVID-19チャレンジ(フェーズ1) | SIGNATE - Data Science Competition
タイトルとURLをコピーしました