ツール&リソース
研究データ管理に役立つツールとリソースのリストです。ここに列挙したツールとリソースは網羅的なものではありません。本サイトの各ページでは、下記のテーブルをフィルターにかけたリストがページの最後に表示されます。ツールやリソースのリンクが切れている、または間違いがある場合は、「お問い合わせ」ページからお知らせください。
ツールまたはリソース | 記述 | 関連ページ |
---|---|---|
データ共有の基準としてのFAIR原則 | NBDC(日本バイオサイエンスデータベースセンター)のウェブサイトでは、「FAIR原則」に関する情報が詳述されています。FAIR原則は「Findable(見つけられる)、Accessible(アクセスできる)、Interoperable(相互運用できる)、Reusable(再利用できる)」の略で、研究データの適切な公開に関する国際的な基準を提供します。このセクションでは、FAIR原則の歴史、内容、及び日本および国際的な研究コミュニティでの応用について詳しく説明されています。 | 概要 |
FAIRassist.org | FAIRassist.orgは、FAIRsharingチームとオックスフォード大学によって開発されたサービスで、研究データのFAIR原則(発見可能、アクセス可能、相互運用可能、再利用可能)への準拠を支援します。このプラットフォームは、研究者がデータ管理計画を作成し、データセットをFAIR原則に沿って整備するためのガイドラインとツールを提供します。 | コンプライアンスの監視および測定 |
FAIR Evaluator | FAIR Evaluatorは、データセットやリソースがFAIR原則(発見可能、アクセス可能、相互運用可能、再利用可能)にどの程度準拠しているかを評価するためのオンラインツールです。このツールは、FAIR原則に関連する様々な指標に基づいてデータセットを評価し、結果を視覚的に表示します。これにより、データのFAIR性を改善するための具体的なフィードバックを提供します。 | コンプライアンスの監視および測定 |
FAIR Cookbook | FAIRplusプロジェクトの「FAIRデータの評価」セクションは、データのFAIR原則(発見可能、アクセス可能、相互運用可能、再利用可能)に準拠するための実践的なアドバイスを提供します。ここでは、データセットのFAIRnessを評価する方法、関連する指標、および評価のためのツールについて詳しく説明しています。データ管理に関するベストプラクティスの適用方法についても触れています。 | コンプライアンスの監視および測定 |
FAIR plus project | FAIRplusプロジェクトは、生命科学データのFAIR化(発見可能、アクセス可能、相互運用可能、再利用可能)を目的とした取り組みです。2019年から2022年まで実施されたこのプロジェクトは、FAIR化フレームワークを開発し、ツールやガイドラインを提供しています。このフレームワークは、データのFAIR化に向けた具体的な目標設定、プロジェクトの詳細な検討、FAIR化サイクルの反復的実施と評価をサポートします。 | コンプライアンスの監視および測定 |
FAIR Data Maturity Model. Specification and Guidelines | Zenodoに掲載されている「FAIR Data Maturity Model: Specification and Guidelines」は、データの発見性、アクセシビリティ、相互運用性、再利用可能性を評価するためのガイドラインです。この文書は、FAIR原則に基づいた半定量的な評価のための指標と成熟度レベルを確立し、コミュニティのニーズに合わせたFAIRnessの評価方法をさらに整えることを目指しています。 | コンプライアンスの監視および測定 |
Metrics for the evaluation of FAIRness | GO FAIRのウェブサイトに掲載されている「FAIRnessの評価のための指標」は、デジタルリソースの「発見可能性、アクセス可能性、相互運用性、再利用可能性」を半定量的に評価するためのコアセットを提案しています。このペーパーは、FAIR原則の具体的な評価方法に関する初めての重要なステップであり、コミュニティの議論と共通指標の最終的な採用に向けた基盤となります。 | コンプライアンスの監視および測定 |
Galaxy | 「Galaxy Project」は、生物学的データ分析のためのオープンソースプラットフォームです。ユーザーは、グラフィカルなウェブインターフェイスを通じて様々なツールを使用し、ワークフローに組み込むことができます。データの管理、結果の共有、可視化の作成に役立ち、実験の再現性を確保するための情報を取り込みます。 | データ分析 データストレージ |
R Markdown | R Markdownは、RStudioが提供するツールで、分析から高品質な文書、レポート、プレゼンテーション、ダッシュボードの作成までを支援します。これは、ナラティブテキストとコードを組み合わせて、エレガントにフォーマットされた出力を生成するためのプロダクティブなノートブックインターフェースを使用します。R、Python、SQLなど複数の言語をサポートし、HTML、PDF、MS Word、Beamer、HTML5スライドなど多数の静的および動的な出力形式を提供しています。 | データストレージ |
OSF | OSF (Open Science Framework)は、研究プロジェクトのコラボレーション、管理、およびアーカイビングを支援するオープンソースのプラットフォームです。研究の透明性と再現性を促進するために設計されており、研究者がプロジェクトの資料、データ、および結果を管理し、共有することができます。 | データストレージ |
FAIRDOM-SEEK | FAIRDOM-SEEKは、科学研究のデータセット、モデル、シミュレーション、プロセス、研究成果を共有するためのオープンソースのウェブベースプラットフォームです。このプラットフォームは、アイテム間の関連性と、それらに関連する人や組織の情報を保存します。FAIRDOM-SEEKはISAインフラストラクチャを基盤とし、生物学以外の分野でも使用できるように拡張されています。柔軟な共有許可設定を提供し、DOI生成や研究成果の公開もサポートしています。 | データストレージ |
Microsoft Power Apps | Microsoft Power Appsは、ローコード開発プラットフォームで、ビジネスアプリケーションの迅速な構築を可能にします。このツールは、AIを活用してプロセスを自動化し、カスタムコードの開発もサポートします。Power Appsは、データソースへの簡単な接続と多様なアプリケーションの展開を実現し、企業の生産性向上とデジタルトランスフォーメーションを支援します。 | データストレージ |
iRODS | iRODS(Integrated Rule-Oriented Data System)は、オープンソースのデータ管理ソフトウェアで、データストレージリソースを仮想化し、データの所在地やデバイスに関わらず、ユーザーがデータを管理できるようにします。データの仮想化、発見、ワークフローの自動化、セキュアなコラボレーションを提供し、研究、商業、政府機関など様々な業界で使用されています。 | データストレージ |
GakuNin RDM | GakuNin RDMは、国立情報学研究所が提供する研究データ管理システムです。研究チームが持つ多様なデータを一元管理し、効率的で公正なデータ活用をサポートします。 | データストレージ |
Box | Box Japanのクラウドストレージソリューションは、多様な働き方を支援するためのプラットフォームです。このサービスは、スマートフォンやタブレットなどのモバイルデバイスからどこでもアクセス可能で、ファイルの閲覧や編集を容易にします。企業や組織が直面するIT環境の問題を解決するための統合ソリューションを提供し、セキュリティリスクの軽減やデジタル化の推進に貢献しています。 | データストレージ |
Microsoft OneDrive | Microsoft OneDriveは、Microsoft 365の一部として提供されるクラウドベースのストレージサービスです。ユーザーは、ファイルや写真を安全に保存し、どこからでもアクセスできます。デバイス間の同期機能や共有オプションも備えており、個人利用からビジネス利用まで幅広く対応しています。OneDriveは、効率的なファイル管理とセキュリティを重視したクラウドソリューションを提供します。 | データストレージ |
NextCloud | Nextcloudは、オープンソースのクラウドコンテンツコラボレーションプラットフォームで、リアルタイムドキュメント編集、ビデオチャット、グループウェアをモバイル、デスクトップ、ウェブで提供しています。自社のサーバーにデータを保存し、透明なデータアクセス、制御、コミュニティ支援を実現しています。Nextcloudは、プライバシーとセキュリティに重点を置いたエンタープライズ向けの自己ホスト型クラウドファイルストレージ技術を提供します。 | データストレージ |
GitHub | 「GitHub」は、ソフトウェア開発者がコードをホストし、共同で作業するためのプラットフォームです。オープンソースプロジェクトやプライベートリポジトリの管理に適しており、全世界の開発者に利用されています。 | 文書化とメタデータ データ整理 データストレージ |
Dropbox | 「Dropbox」は、ファイルの保存、共有、アクセスを可能にするクラウドベースのサービスです。文書の編集、バックアップ、電子署名などの機能を備えており、ビジネス及び個人用途の両方に適しています。セキュリティ機能やモバイルアプリも提供し、効率的なコラボレーションを支援します。 | 文書化とメタデータ データストレージ |
DataCite Commons (Repositories) | DataCite Commonsは、FAIR原則に基づいてデータリポジトリを検索するためのツールとして利用することができます。これにより、研究者は適切なリポジトリを容易に見つけ、データを共有することができます。このサービスは、データセットの発見とアクセスを支援し、科学的なコミュニケーションとコラボレーションを促進します。 | データ公開 |
Creative Commons licenses | クリエイティブ・コモンズは、クリエイターが作品を共有するためのオープン・ライセンスやその他の法的ツールを提供する非営利団体です。クリエイティブ・コモンズライセンスは無料で利用できます。 | ライセンス データ公開 |
DDBJ | 欧州と米国の対応機関(EBIとNCBI)と密接に関係しながら、DDBJ/EMBL/GenBank国際塩基配列データベースを構築している三大国際データバンクのひとつです。" | 識別子 データ公開 |
re3data | 「re3data.org」は研究データリポジトリのカタログサイトであり、データ共有と透明性をサポートするための詳細なリポジトリ情報を提供しています。 | 既存データ ライセンス データ公開 |
Core Certified Repositories | CoreTrustSealは、データリポジトリの品質と信頼性を評価し認証する国際的な非営利団体です。認証されたリポジトリは、データの保存、アクセシビリティ、セキュリティ、および持続可能性に関する厳格な基準を満たしています。このウェブサイトには、様々な科学分野で認証されたデータリポジトリの一覧が掲載されており、各リポジトリの詳細情報と認証の有効期限も記載されています。 | データ公開 |
Scientific Data誌推奨リポジトリ | Scientific Dataのデータリポジトリガイドは、データ記述子に付随するデータセットの公開を義務付け、適切な公開データリポジトリにデータを提出するよう著者に要求しています。このガイダンスでは、匿名のピアレビュー、データアクセス、保存、リソースの安定性、ライセンス、そして適切なタイプのデータを持つすべての研究者による利用に関する要件を満たすリポジトリを推奨しています。 | データ公開 |
ELIXIR Deposition Databases | ELIXIRヨーロッパのデータデポジションデータベースは、生物分子データの保存と共有を目的としたリソースのリストを提供しています。このプラットフォームは、科学研究におけるデータの長期保存とアクセシビリティを確保するためのガイダンスを提供し、FAIR原則に沿った技術的品質とガバナンス基準を満たすデータベースを選定しています。様々な生物学的データをサポートし、国際コミュニティの研究者による実験データの提出を受け付けています。 | データ公開 |
NBDCヒトデータベース | NBDCヒトデータベースは、ヒト関連のデータを整理し、生命科学の進展に役立てるためのプラットフォームです。このデータベースでは、個人情報の保護を重視しながら、科学研究のためのデータ共有や利用を推進しています。国立遺伝学研究所と協力し、ヒト関連データを公開しており、研究データの提供及び利用方法についての情報も提供しています。 | データ公開 |
ImageMagick | ImageMagickは、デジタル画像の編集や操作に使用される無料でオープンソースのソフトウェアスイートです。JPEG、PNG、GIF、TIFF、PDFなど多くのファイル形式をサポートし、コマンドラインインターフェースやAPIを通じて複雑な画像処理タスクを実行できます。Web開発、グラフィックデザイン、ビデオ編集など幅広い分野で活用されており、スクリプトと自動化のサポートを含む多彩な機能を提供しています。 | データ分析 |
Kubernetes | Kubernetes(略称K8s)は、コンテナ化されたアプリケーションのデプロイメント、スケーリング、管理を自動化するオープンソースシステムです。アプリケーションを構成するコンテナを論理的なユニットにグループ化し、管理と発見を容易にします。Googleによって設計されたこのシステムは、現在Cloud Native Computing Foundationによって維持されています。 Kubernetesは、さまざまなコンテナランタイムと互換性があり、大規模なクラウドネイティブワークロードの実行と管理に適しています。このプラットフォームには複数のディストリビューションがあり、独立ソフトウェアベンダーや主要なパブリッククラウドベンダーによって提供されています。 | データ分析 |
Docker Compose | Docker Composeは、マルチコンテナDockerアプリケーションを定義し、実行するためのツールです。Composeを使用すると、YAMLファイルを作成してアプリケーションのサービスを設定し、単一のコマンドですべてのサービスを起動または停止できます。このツールは、開発、ステージング、生産環境など、あらゆる環境で機能します。 Docker Composeの利点の一つは、アプリケーションスタックをファイルに定義し、プロジェクトリポジトリのルートに保持することで、他の人がプロジェクトに簡単に貢献できるようにすることです。他の人はリポジトリをクローンし、Composeを使用してアプリケーションを起動するだけです。多くのプロジェクトがGitHubやGitLabでこの方法を採用しています。 | データ分析 |
Biocontainers | BioContainersは、バイオインフォマティクスソフトウェアのコンテナとパッケージを作成、保存、配布することを目指すオープンソースプロジェクトです。このコミュニティ主導のフレームワークは、プラットフォームに依存しない実行環境を提供し、メタデータ、バージョン、ライセンス、ソフトウェア依存関係などを標準化するためのガイドラインを開発しました。BioContainersは、バイオインフォマティクス研究のための強力な分析パイプラインを組み合わせることが可能で、各種研究室でソフトウェアの簡単なインストール、複数バージョンの維持が可能です。 | データ分析 |
RedHat Quay.io | 「Quay」は、プライベートおよびパブリックなコンテナイメージのセキュアなホスティングを提供するクラウドベースサービスです。ユーザーは、イメージの構築、ストレージ、配布を行うことができます。セキュリティスキャン、リポジトリのアクセス管理、イメージの自動ビルドなどの機能が含まれています。 | データ分析 |
DockerHub | 「Docker Hub」は、Dockerイメージの共有と配布のためのクラウドベースのサービスです。ユーザーは、公式イメージやコミュニティが作成したイメージを検索、ダウンロード、共有することができます。また、プライベートリポジトリのホスティングや自動ビルド機能も提供しています。Dockerイメージの中央集約地として、開発者やシステム管理者に広く利用されています。 | データ分析 |
Podman | 「Podman」は、root権限を必要とせずにコンテナを管理するためのツールです。Dockerに似たコマンドラインインターフェースを提供し、イメージの管理、コンテナの作成、実行、監視が可能です。さらに、Podmanはデーモンレスで動作し、複数のコンテナを同時に管理する「ポッド」の概念を導入しています。 | データ分析 |
uDocker | 「udocker」は、root権限を必要とせずにDockerコンテナを実行できるツールです。LinuxシステムでDockerが利用できない場合にも、非特権ユーザーによるコンテナのダウンロードと実行を可能にします。主にバッチシステムやインタラクティブクラスターでの使用を想定しており、ユーザーのホームディレクトリ内で完全に実行できます。さまざまな実行方法をサポートし、Dockerの一部の機能を模倣します。 | データ分析 |
Gradle | 「Gradle」は、Java、C++、Pythonなどの多くのプログラミング言語やプラットフォームに対応するオープンソースのビルド自動化システムです。柔軟性とパフォーマンスに重点を置いており、大規模なプロジェクトのビルドとデプロイメントを効率的に管理します。DSLに基づく構成により、複雑なビルドスクリプトを簡潔に記述できます。 | データ分析 |
Apache Maven | 「Apache Maven」は、プロジェクトのビルド、レポーティング、ドキュメント管理を中央の情報から管理するソフトウェアプロジェクト管理ツールです。プロジェクトオブジェクトモデル(POM)のコンセプトに基づき、開発プロジェクトを効率的に管理します。 | データ分析 |
CRAN | 「CRAN (The Comprehensive R Archive Network)」は、R言語のオープンソースパッケージを集約するプラットフォームです。多様な統計分析、データ処理、視覚化ツールが提供されており、Rユーザーにとって重要なリソースです。Rの最新バージョンのダウンロードやドキュメントも提供しています。 | データ分析 |
renv | 「renv」はRプロジェクトのための環境管理ツールで、プロジェクトごとに異なるパッケージとそのバージョンを管理します。各プロジェクトのライブラリを分離し、ポータブルで再現可能な環境を作成することができます。このツールは、プロジェクトのパッケージを「renv.lock」ファイルに記録し、必要なパッケージを他の環境で簡単に再インストールできるようにします。 | データ分析 |
npm | 「npm」は、JavaScriptのパッケージマネージャーであり、数百万の開発者に利用されています。これは、JavaScript開発のためのオープンソースとプライベートパッケージを管理するための主要なプラットフォームです。世界最大のソフトウェアレジストリであり、多様なパッケージを提供しています。 | データ分析 |
venv | このページでは、Pythonの仮想環境の作成と管理に関するガイドが提供されています。仮想環境を使用すると、プロジェクトごとに異なるパッケージやPythonのバージョンを分離し、管理することができます。この機能は、プロジェクト間の依存関係の衝突を防ぎ、開発環境を整理するのに役立ちます。 | データ分析 |
pip | 「Pythonのインストールモジュール」のページは、Pythonのパッケージ管理ツール「pip」や仮想環境の作成、使用方法に関する公式ガイドです。Python 3.4以降ではpipがデフォルトで含まれ、パッケージインデックスからモジュールのインストールやアップグレード方法を詳述しています。また、複数のPythonバージョンを扱う際のガイドラインや共通のインストールの問題に対する解決策も提供しています。 | データ分析 |
rvm | 「RVM (Ruby Version Manager)」は、Rubyの複数のバージョンを管理し、切り替えるためのコマンドラインツールです。これにより、開発者は異なるプロジェクトで異なるRubyバージョンやgemセットを簡単に使い分けることができます。RVMは、Ruby環境の設定を柔軟に管理し、プロジェクトの要件に合わせた環境を構築するのに適しています。 | データ分析 |
RubyGems | 「RubyGems.org」は、Rubyプログラミング言語用のパッケージ(gem)をホストするコミュニティサービスです。このサイトでは、Rubyのgemを検索、インストール、公開することができます。開発者は自分のgemを簡単に公開し、他のユーザーは必要なgemを探してインストールすることが可能です。APIを通じてgemに関する詳細情報を得ることもできます。 | データ分析 |
Windows Package Manager | 「Windows Package Manager」は、コマンドラインツール(WinGet)とサービスのセットを含む包括的なパッケージマネージャーソリューションです。開発者、独立系ソフトウェアベンダー(ISV)、企業組織がソフトウェアアプリケーションを管理し、配布するために使用されます。パッケージマネージャーは、ソフトウェアのインストール、アップグレード、設定、利用を自動化するためのシステムまたはツールセットです。 | データ分析 |
Chocolatey | 「Chocolatey」はWindows向けのパッケージマネージャーで、ソフトウェアのインストール、アップデート、管理を自動化します。このツールは、開発者やシステム管理者にとって便利で、コマンドラインインターフェースを通じて多くのソフトウェアパッケージのインストールや管理を行えます。 | データ分析 |
Macports | 「MacPorts」は、MacOS向けのオープンソースのパッケージ管理システムです。これにより、コマンドラインからオープンソースソフトウェアのコンパイル、インストール、アップグレードが簡単に行えます。数千に及ぶパッケージが提供されており、MacOS Big Sur v11以降のバージョンに対応しています。 | データ分析 |
Homebrew | 「Homebrew」は、MacOSおよびLinux用のフリーでオープンソースのパッケージ管理システムです。このツールを使用することで、ユーザーはコマンドラインから簡単にソフトウェアをインストール、更新、管理できます。特に開発者にとって便利なツールであり、幅広いパッケージをサポートしています。 | データ分析 |
R Studio IDE | 「RStudio」は、RとPythonのための統合開発環境(IDE)で、Posit社(以前のRStudio, PBC)が提供しています。このIDEは、コードの編集、実行、デバッグ、プロット作成などをサポートし、データサイエンスのための効率的なワークフローを提供します。オープンソース版と商用版があり、Windows、Mac、Linux上で動作します。 | データ分析 |
Jupyter | 「Jupyter」は、データサイエンス、科学計算、教育、データ分析をサポートするオープンソースのインタラクティブな計算環境です。主にJupyter Notebookとして知られ、研究者やデータサイエンティストがコード、数式、ビジュアライゼーションを組み合わせたドキュメントを作成できます。多様なプログラミング言語に対応し、共同作業や教育にも広く利用されています。 | データ分析 |
cromwell | 「Cromwell」は、科学的ワークフローを対象としたワークフロー管理システムです。オープンソースであり、柔軟な設計を持ち、広範な計算環境での利用が可能です。このシステムは、ワークフローの効率的な実行と管理をサポートし、科学的研究のデータ処理と解析において重要な役割を果たしています。 | データ分析 |
snakemake | 「Snakemake」は、生物情報学とデータ分析のためのワークフロー管理システムです。Pythonの言語構文をベースにしており、複雑なデータ分析ワークフローの記述と実行を容易にします。スケーラビリティと再現性に重点を置いており、クラウドやHPC環境での実行が可能です。 | データ分析 |
nextflow | 「Nextflow」は、データ駆動型の計算パイプラインのためのDSL(ドメイン固有言語)を提供するプラットフォームです。ソフトウェアコンテナを利用して、スケーラブルで再現性のある科学的ワークフローを実現します。複雑な並列およびリアクティブワークフローの実装とデプロイメントを容易にし、クラウドやクラスター上での実行をサポートします。 | データ分析 |
cwltool | 「cwltool」は、Pythonで書かれたCommon Workflow Language(CWL)のリファレンス実装です。このツールは、CWLファイルの検証と実行、関連ツールの提供に焦点を当てています。Python 3.xに対応し、CWLの標準に準拠した高機能なワークフローの作成と実行を可能にします。 | データ分析 |
toil-cwl-runner | 「Toil」は、Common Workflow Language (CWL) をサポートする高性能なワークフローシステムです。ローカル、クラウド、HPC環境での実行をサポートし、CWL v1.0, v1.1, v1.2 標準に対応しています。このドキュメントは、Toilを使用してCWLワークフローを実行するための詳細なガイダンスを提供しており、様々な設定やワークフローの管理についての情報が含まれています。 | データ分析 |
Arvados | 「Arvados」は、大規模な生物医学データの管理と処理を目的としたオープンソースプラットフォームです。データとワークフロー管理機能を統合し、ペタバイト級のデータ分析と再現可能な計算ワークフローを実行します。Arvadosは、データライフサイクル全体をサポートし、データの取得から分析、安全な共有、監査、再利用に至るまでのプロセスをカバーしています。 | データ分析 |
Sylabs | 「Sylabs」は、Singularityコンテナプラットフォームのドキュメントを提供するサイトです。このドキュメントは、Singularityを使用して、軽量でポータブル、かつセキュアなコンテナを作成し、管理する方法に関する詳細なガイドを含んでいます。Singularityは、特に高性能計算環境やデータ集約型のアプリケーションに適しており、科学的研究やデータ解析の分野で広く利用されています。 | データ分析 |
Docker | 「Docker」は、アプリケーションの開発、共有、実行を容易にするためのコンテナプラットフォームです。このツールは、開発環境の迅速なセットアップ、アプリケーションのコンテナ化、一貫性のあるデリバリーを支援し、クラウドやオンプレミスでの運用が可能です。Docker Hubを通じてコンテンツを共有し、チーム間での協力も促進します。 | データ分析 |
Bioconda | 「Bioconda」は、生物情報学関連のソフトウェアパッケージをインストールするためのオープンソースのCondaチャネルです。1400人以上のコントリビューターによって維持されており、生物学的なデータ処理や解析に特化した多様なツールを提供します。また、Condaパッケージと対応するDockerコンテナが自動的に作成され、利用可能です。 | データ分析 |
Anaconda.org | 「Anaconda」は、データサイエンスと機械学習のためのオープンソースプラットフォームです。PythonやR言語のパッケージ管理とデプロイメントを容易にすることで、データ分析、可視化、機械学習のプロジェクトを効率的に実行できます。主に研究者、データサイエンティスト、開発者向けです。 | データ分析 |
git | 「Git」は、分散型バージョン管理システムで、ソフトウェア開発におけるコードの変更を効率的に追跡し、複数人での共同作業をサポートします。Gitは高速であり、ブランチ、マージ、再ベースなどの機能を備えており、大規模なプロジェクトでも効果的です。オープンソースで、多くのオペレーティングシステムで利用可能です。 | データ分析 |
OpenRefine | 「OpenRefine」は、雑多なデータの処理に特化した無料のオープンソースツールです。データのクリーニング、異なる形式への変換、ウェブサービスや外部データを利用した拡張が可能です。主な機能には、データセットのビューにフィルターを適用して操作するファセット、類似値の統合による不整合の修正、外部データベースとのリコンサイルなどが含まれます。 | データ品質 |
Talend Open Studio | 「Talend Open Studio」は、SourceForgeで利用可能なオープンソースのデータ統合ソフトウェアです。このツールは、データ抽出、変換、ロード(ETL)プロセスの設計と実行を支援し、データウェアハウスやビジネスインテリジェンスシステムとの統合を容易にします。主にデータアナリストや開発者向けに設計されています。 | データ品質 |
Pentaho Community Edition (CE) | 「Pentaho Community Edition」は、Hitachi Vantaraによって提供されるオープンソースのデータ統合とビジネスアナリティクスのプラットフォームです。データの変換、統合、分析をサポートし、ビジネスインテリジェンス機能を提供します。この無料版は、データの可視化、レポート作成、データマイニングに特化しており、開発者やデータアナリストに向けて設計されています。 | データ品質 |
REDCap | 「REDCap」は、オンライン調査とデータベースの管理のためのセキュアなウェブアプリケーションです。21 CFR Part 11、FISMA、HIPAA、GDPRなどに準拠し、研究研究や運用におけるオンラインおよびオフラインのデータキャプチャを支援します。REDCapコンソーシアムは、多数の国際的な機関パートナーで構成されており、それぞれが独自のREDCapシステムを利用・サポートしています。 | データ品質 |
BitBucket | 「Bitbucket」は、チームがコードを共有し、共同で作業するためのWebベースのバージョン管理サービスです。GitとMercurialリポジトリのホスティングに対応し、プルリクエスト、コードレビュー、CI/CDパイプラインなどの機能を提供します。個人開発者や小規模チームに特に適しています。 | データ整理 |
Renamer4Mac | 「Renamer」は、Mac用のバッチファイル名変更ソフトウェアです。複数のファイルやフォルダの名前を一度に効率的に変更できます。順番付け、テキストの検索と置換、大文字・小文字の変換、ID3タグによる音楽ファイルの整理、EXIFタグを利用した日付や時間の挿入などの機能があります。 | データ整理 |
Bulk Rename Utility | 「Bulk Rename Utility」は、Windows用のファイル名変更ソフトウェアです。ファイルやフォルダの名前を柔軟な基準に基づいて迅速に変更できます。日付や時間のスタンプの追加、テキストの挿入や置換、ケースの変換などの機能があり、特に大量のファイルの名前を一度に変更する際に便利です。個人利用は無料で、ビジネス用途には商用ライセンスが必要です。 | データ整理 |
Choose a license | 「Choose a License」は、オープンソースプロジェクトに適切なライセンスを選択するためのガイドを提供するウェブサイトです。このサイトでは、MITライセンスやGNU GPLv3など、さまざまなオープンソースライセンスの特徴と利用条件を解説し、プロジェクトのニーズに最適なライセンスを見つけるための情報を提供しています。 | ライセンス |
研究データの公開・利用条件指定ガイドライン | 本ガイドラインは、研究データ利活用協議会(RDUF)研究データライセンス小委員会によって作成された、研究データの公開と公開に当たっての利用条件指定に関するガイドラインです。研究データの公開に当たり一般的に留意が必要となる情報や事例を、その判断プロセスとともに整理することで、データの公開者が適切な利用条件の元でデータ公開を可能にすることを目的としています。また、データの利用者が利用条件を確認する場面において、データの公開者が求める利用条件の背景を容易に理解できるツールとしての活用も見込んでいます。 | ライセンス |
Conformant Licenses | 「Open Definition Licenses」ページでは、オープンデータ、オープンコンテンツ、オープンナレッジの原則に準拠するライセンスを紹介しています。このページは、リソースをオープンにするための様々なライセンスのオプションを提供するとともに、それらの互換性や再利用性に関する情報も提供しています。 | ライセンス |
Open Definition | 「Open Definition」は、オープンデータ、オープンコンテンツ、オープンナレッジに関して「オープン」という用語の意味を明確にする原則を定めるサイトです。同サイトでは、「オープン」の意味を「だれもが自由にアクセスし、使用し、変更し、あらゆる目的で共有できること」と定義し、オープンな素材間の品質保証と互換性の促進を目指しています。 | ライセンス |
FAIRsharing | 「FAIRsharing Policies」ページでは、データ、ソフトウェア、その他の研究資産の共有と再利用を促進するための方針が紹介されています。このページは、研究コミュニティ、出版社、資金提供機関などが実施する様々なポリシーを集約し、FAIR原則に基づいたデータ管理や公開の慣行を支援するための情報源として機能しています。 | 既存データ 文書化とメタデータ |
Ontobee | 「Ontobee」は、リンクされたデータサーバーとして機能し、オントロジーと語彙を視覚化、クエリ、統合、分析することを目的としています。このサイトは、HTMLウェブページとしてオントロジーの各用語のURIを動的に解決し、ユーザーフレンドリーなウェブブラウジングとセマンティックウェブアプリケーションに対応しています。 | 文書化とメタデータ |
EMBL-EBI Ontology Lookup Service | 「Ontology Lookup Service (OLS)」は、生命科学分野の様々なオントロジーを検索し、探索するためのサービスです。このプラットフォームは、生物学的な用語やクラスに関する詳細情報を提供し、研究データの注釈付けや分析に役立てることができます。 | 文書化とメタデータ |
Linked Open Vocabularies (LOV) | 「Linked Open Vocabularies (LOV)」は、リンクトデータとセマンティックウェブのためのオントロジーと語彙を集約するプラットフォームです。このサイトは、様々な分野にまたがるオントロジーを検索、閲覧し、比較するためのリソースを提供し、相互運用性の高いアプリケーションの開発を支援します。 | 文書化とメタデータ |
Metadata Standards Catalog | 「RDA Metadata Standards Catalog」は、研究データ同盟(RDA)の活動の一環として作成された、様々な分野の研究データに適用されるメタデータ標準のディレクトリです。 | 文書化とメタデータ |
European Nucleotide Archive | 「ENA(European Nucleotide Archive)」は、遺伝子配列データや関連情報を提供するデータベースです。このアーカイブは、DNAおよびRNA配列データの収集、保存、公開を行っており、生命科学研究のための重要なリソースとなっています。 | 文書化とメタデータ |
ArrayExpress | 「ArrayExpress」は、EBIによって提供される機能ゲノミクスデータのアーカイブです。このプラットフォームは、遺伝子発現実験のデータセットを集約し、研究コミュニティに公開しています。MIAME準拠の実験データとメタデータのアクセスを提供し、研究の透明性と再現性を高めることを目指しています。 | 文書化とメタデータ |
Annotare 2.0 submission tool | 「Annotare」は、機能ゲノミクスデータをBioStudiesのArrayExpressコレクションに提出するためのツールです。MAGE-TAB形式を生成し、MIAME/MINSEQE/MINSCEのガイドラインに準拠した高いメタデータ標準をサポートしています。これにより、研究者は自身の実験データを効率的に公開し、広範な研究コミュニティと共有できます。 | 文書化とメタデータ |
Figshare | ユーザーの研究者が、自らの研究成果のすべてを、引用、共有、発見が可能な形で公開することができるリポジトリです。研究データのショーケース、研究結果のインパクトを測る場、カスタマイズ不要の実装ツールなどとして利用できます。 | 文書化とメタデータ |
Mendeley | 「Mendeley」は、研究文献の管理と共有を支援するプラットフォームです。これを使用することで、研究者は文献の参照、引用、目録作成を簡単に行え、さまざまなジャーナルスタイルに対応した書誌情報を生成できます。また、デスクトップやブラウザから文書を追加し、どこからでもアクセス可能なライブラリを利用できます。 | 文書化とメタデータ |
DataCite | 「DataCite Commons」は、科学研究のためのデータを探索し、アクセスするための包括的なプラットフォームです。このサイトでは、研究論文、データセット、ソフトウェア、その他の研究資産のメタデータと関連リンクを提供しており、学術コミュニティにとって重要な情報源となっています。 | 既存データ |
Google dataset search | 「Google Dataset Search」は、インターネット上の公開データセットを検索するためのツールです。このサービスを利用することで、研究者やデータサイエンティストは、様々な分野のデータセットを見つけることができ、それらを自分の研究やプロジェクトに活用することが可能です。 | 既存データ |
CiNii Research | 「CiNii Research」は、日本の学術情報を集約したデータベースで、研究論文、書籍、研究データなどの情報を検索可能です。 | 既存データ |
ELIXIR communities in Life Sciences | ELIXIRのコミュニティページは、科学や技術のテーマを代表する専門家グループが集まり、ELIXIRネットワークを通じて標準、サービス、トレーニングの開発を推進しています。各コミュニティは、特定の分野に焦点を当て、その分野の基準、ツール、リソースの開発に取り組んでいます。 | 既存データ |
Scientific Data | 「Scientific Data」は、nature.comにホストされている査読付きのオープンアクセスジャーナルで、様々な科学分野にわたるデータ記述、方法論、技術分析を発表しています。このジャーナルは、FAIR原則に準拠した高品質なデータの重要性を強調しており、研究者がデータセットを公開および発見するためのリソースとなっています。 | 既存データ |
identifiers.org | データコレクション(管理されたボキャブラリ、データベースなど)およびその URI、対応する物理的 URL(またはリソース)のカタログを核として構成されたレジストリです。これらのリソースは、データへのアクセシビリティおよびリソリューション・メカニズムの妥当性を確保するため、日々モニタリングされています。 | 識別子 |
研究データへのDOI登録ガイドライン | DOI登録の実験プロジェクトにおいて、参加各グループが、研究データに対して DOI 登録のテストを行った。これによって得られた知見と、ミーティング等において議論された内容をもとに、本ガイドラインを作成した。作成にあたっては、今後、研究機関等がデータに対する DOI 登録を開始する際の指針になり、実作業への参考となることを目指した。 | 識別子 |
OntoMaton | OntoMaton facilitates ontology search and tagging functionalities within Google Spreadsheets. It has been developed by the ISA Team at the University of Oxford's e-Research Centre. | 識別子 |
RightField | RightField is an open-source tool for adding ontology term selection to Excel spreadsheets. RightField is used by a ‘ Template Creator’ to create semantically aware Excel spreadsheet templates. The Excel templates are then reused by Scientists to collect and annotate their data; without any need to understand, or even be aware of, RightField or the ontologies used. | 識別子 |
JaLC | Japan Link Center (JaLC) はDOI財団から、国際的な識別子であるDOI登録機関(RA)に認定された日本で唯一の機関です。電子化された学術論文、書籍、論文付随情報、研究データなどにDOIを登録し、コンテンツの所在情報 (URL) 等とともに管理しています。国内学術機関の4機関が共同で運営しています。 | 識別子 |
Generalist repositories (SpringerNature) | Scientific Data mandates the release of datasets accompanying our Data Descriptors, but they do not themselves host data. Instead, they ask authors to submit datasets to an appropriate public data repository. Data should be submitted to discipline-specific, community-recognized repositories where possible. Where a suitable discipline-specific resource does not exist, data should be submitted to a generalist repository. | 共有 |
酒類総合研究所 | 酒類総合研究所では、都道府県工業技術センター、酒造組合及び酒類製造業者等が所有する麴菌や酵母などの酒類醸造微生物リソースの災害い等による亡失を防止することを目的として、醸造微生物保存(バックアップ)の受託業務を行っています。 | 保存 |
ナショナルバイオリソースプロジェクト | 28機関のリソースセンターをつなぐメタデータサイトで、ライフサイエンス研究の基礎・基盤となるバイオリソース(動物、植物等)について収集・保存・提供を行うとともに、バイオリソースの質の向上を目指し、保存技術等の開発、ゲノム等解析によるバイオリソースの付加価値向上により時代の要請に応えたバイオリソースの整備を行っています。また、バイオリソースの所在情報等を提供する情報センター機能を強化しています。 | 保存 |
Arvados | With Arvados, bioinformaticians run and scale compute-intensive workflows, developers create biomedical applications, and IT administrators manage large compute and storage resources. | 保存 |