BigGorilla: データ統合とデータ前処理のエコシステム

BigGorilla は、データサイエンスにおけるデータの統合・解析タスクをサポートする、Pythonベースのデータ統合・前処理のオープンソース・エコシステムです。データ・サイエンティストが多様なソースから集めたデータを単一のデータベースにまとめて解析するまでに必要な一般的なステップを、集約し文書化します。各ステップにおいて適用される既存テクノロジーと共に、開発の余地がある有望なテクノロジーも記述していきます。

BigGorillaの様々なコンポーネントは無料でダウンロードして使用いただけます。利用したデータ・サイエンティストの皆さまには、BigGorillaにコード、データベース、ユースケースの提供で協力をお願いしています。私たちはBigGorillaプロジェクトの開発、文書作成、ツール提供を通して、未来のデータ・サイエンティストの育成に貢献したいと考えています。

Githubを見る