📜  2021 年要考虑的 8 大数据科学竞赛(1)

📅  最后修改于: 2023-12-03 15:13:07.319000             🧑  作者: Mango

2021 年要考虑的 8 大数据科学竞赛

数据科学竞赛是提高数据分析能力和实践经验的好方法,以下是 2021 年要考虑的 8 大数据科学竞赛。

1. Kaggle 30 Days of ML

Kaggle 是全球最大的数据科学竞赛平台,每年都会举办多个数据科学竞赛。今年 Kaggle 举办的一个数据科学竞赛是 30 Days of ML,这是针对 Machine Learning 初学者设计的,为期 30 天,有数据科学的基础课程和编程挑战,目的是帮助初学者更好地上手。

2. Kaggle Titanic: Machine Learning from Disaster

这是一个著名的竞赛,旨在通过机器学习技术预测乘客是否在船沉没中幸存。参赛者需要用训练数据集构建一个分类器,然后用测试数据集上的样本测试分类器的准确性。此竞赛可以让参加者掌握预测建模和特征工程技能。

3. Kaggle Mechanisms of Action (MoA) Prediction

该数据科学竞赛由 DrugDiscovery@Home 提供,旨在预测化合物的机制,即化合物对基因的影响方式。该竞赛不仅为参赛者提供了化合物和基因的信息,还提供其基于机器学习模型的预测结果。因此,参赛者可以比较自己的模型预测结果,提高模型的准确性。

4. IEEE-CIS Fraud Detection

该数据科学竞赛由 IEEE Computational Intelligence Society 提供,旨在构建欺诈检测模型,用于检测信用卡欺诈。比赛提供来自信用卡交易的数据集,参赛者需要构建一个模型来预测哪些交易是欺诈性的。该竞赛旨在帮助参赛者掌握分类问题、特征工程和模型优化技巧。

5. Microsoft Malware Classification Challenge

该竞赛基于 Microsoft 预测恶意软件的分类,该竞赛提供了大量的恶意软件数据集,参赛者需要通过构建和优化模型来改善分类的精度。该竞赛为信息安全领域的从业者提供一个实践交流平台。

6. Data Science Bowl 2021

Data Science Bowl 2021 由 Kaggle 主办,旨在预测海洋中的短肽分子的功能。该竞赛提供给参赛者大量的遗传序列数据以及分子的测量数据来预测短肽分子的功能。参赛者可以在此竞赛中提高他们的预测建模和特征工程能力。

7. Kaggle SIIM-FISABIO-RSNA COVID-19 Detection

Kaggle SIIM-FISABIO-RSNA COVID-19 Detection 旨在开发机器学习算法来检测和分类 COVID-19 的胸部 X-ray。参赛者需要构建分类器来分辨胸部 X-ray 是否属于 COVID-19 患者。该竞赛提供一个实践平台,有助于参赛者提高他们的图像分类和预测能力。

8. Kaggle TFI Restaurant Revenue Prediction

Kaggle TFI Restaurant Revenue Prediction 旨在预测一个餐厅的收入。参赛者需要使用模型来预测每个餐厅在未来的一个月内的收益。该竞赛有助于参赛者提高他们的预测建模和时间序列分析技能。

以上是 2021 年要考虑的 8 大数据科学竞赛,参加这些竞赛可以帮助程序员提高他们的数据科学技能,深入了解各种数据科学方法和技术的优势和局限性,达到更好的职业发展。