SAINデータプレパレーション データ前処理の課題を一気に解決

ノーコードで操作可能。効率的な前処理で
AI機械学習の利活用を加速。

画像
Scroll Down

AI/機械学習のデータ前処理の
よくある課題

複雑な処理が必要…

画像

AIや機械学習の精度は、データの質に大きく左右される。前処理を適切に実行しないと、最終的な分析やモデルの結果も信頼性が低くなる可能性が高い。

コーディングが必要…

画像

従来のデータ前処理は、高度なコーディングスキルを要求することが多い。これが、多くの非技術者にとっての大きな障壁となっている。

時間がかかる…

画像

データセットのサイズや種類が増えると、それに比例して前処理にかかる時間も増大してしまう。これが生産性の低下を引き起こす一因となる。

SAINデータプレパレーションは、
ノーコードでデータ前処理プロセスの効率化ができます。

4つの特長

01

透明性と効率性を重視した
データ処理

画像
画像
画像
画像

データ処理の各工程を明瞭に可視化するインターフェイスを採用。専門知識がなくても直感的な操作で、煩雑なクレンジングや前処理作業を効率的に進めることができます。

02

多様なデータに対応する
柔軟性

画像

独立したツールとして、特定のデータベースやAIエンジンに縛られず、様々なデータタイプに適応。一つのツールで多岐にわたるデータ処理ニーズに応えます。

03

ノーコードによる前処理機能

画像

コーディングスキルが不要なノーコード環境でデータ前処理機能を実装。データクレンジングとデータエンジニアリングの複雑な処理を、シンプルな操作で実現します。

04

誰でも使える
汎用的なファイル入出力

画像

どんなデータソースからも簡単にデータを取り込めるように設計されており、最も基本的なファイル形式を利用してデータの入出力が可能。これにより、異なるシステムやプラットフォーム間でのデータ連携の手間が大幅に削減されます。

機能と操作性を
30分の実機デモで確認

画像

主な機能

プロセスガイド

データ処理の流れに沿って実施すべきアクションを表示

データチェック

・データ数や欠損値の表示
・各項目のデータ分布のヒストグラムによる可視化

データクレンジング

・データ型の統一、文字コード変換
・欠損値補完
・不要カラムの削除

データエンジニアリング

・文字列結合、指定条件置換
・正規化、常用対数、加減乗除などの演算
・One-Hotなどのエンコーディング

プロセスガイド

データ処理の流れに沿って実施すべきアクションを表示

データチェック

・データ数や欠損値の表示
・各項目のデータ分布のヒストグラムによる可視化

データクレンジング

・データ型の統一、文字コード変換
・欠損値補完
・不要カラムの削除

データエンジニアリング

・文字列結合、指定条件置換
・正規化、常用対数、加減乗除などの演算
・One-Hotなどのエンコーディング

よくある質問

どのようなユーザを対象としていますか?
多種多様なデータを扱うデータサイエンティストからAI機械学習を始めようとしている方まで幅広くご利用いただけます。
・AI機械学習の利用時にデータ作成の煩わしさから逃れたいと思っている方
・データ活用として機械学習の利用を検討しているがAIが読み込めるデータ作成の方法や進め方が分からない方(うまくいかなくて困っている方)
初心者でも使えますか?
はい。ツール内のデータ処理のプロセスにそって作業を行っていただくことで簡単にお使いいただけます。
どのようなファイル形式に対応していますか?
Excel、CSV、TSVのファイル形式に対応しています。
最大何GBのデータまで扱えますか?
1ヶ月のツールの利用容量は20GBとなります。容量が20GBを超える場合は費用が変動する場合があります。
※1ファイルの対応容量は100MBとなりますが、作業工程において追加データの生成が生じた際の容量は150MBまで扱うことが可能です。
オペレーティングシステムやブラウザの制約はありますか?
制約はございませんが、推奨環境は以下となります。
・推奨ブラウザ:Chrome(FirefoxやEdgeでも動作しますがレイアウトが崩れる可能性がございます)
・ディスプレイ(モニタ)サイズ:12.1インチ以上 ※パソコンでの利用を推奨しております。
データはクラウド上で処理されますか、それともローカルで処理されますか?
クラウド上で処理されます。お使いのPCのスペックに依存することなく作業を行っていただけます。
欠損値の処理はどのように行えますか?
欠損値は以下の方法での置き換えを行うことで機械学習利用時の影響を軽減させることが可能です。
・数値の場合:最頻値、平均値、中央値、ゼロ
・文字列の場合:最頻値、特定文字列
データの正規化やエンコーディングはサポートしていますか?
正規化、エンコーディングともにサポートしています。エンコーディングは下記手法を提供しています。
・One-Hotエンコーディング
・Labelエンコーディング
・Targetエンコーディング
データの前処理後、どのような形式で出力できますか?
アップロードしたファイル形式(Excel、CSV、TSV)で出力されます。
基本はSJIS形式で出力されますが、UTF-8の場合はUTF-8形式で出力されます。
このツールの価格はいくらですか?
こちらよりお気軽にお問い合わせください。
企業ライセンスは提供していますか?
ご相談となります。
アカデミック向け価格はありますか?
中学校、高校、専門学校、大学に向けた特典をご用意しています。お問い合わせください。
技術的なトラブルや質問があった場合、どこに連絡すればよいですか?
下記SAINデータプレパレーションツールユーザー専用のサポート窓口にて、メールにて承ります。
ツールのアップデートは定期的に行われますか?
セキュリティ対応や機能追加など随時アップデートを行います。
アップデート時に追加料金はかかりますか?
基本的なアップデートについては追加料金は必要ございません。
一部、有料オプションとなる機能追加を行う場合もありますが、その際には事前に内容、料金、無償試用期間等について、事前にご案内いたします。
データのプライバシーやセキュリティはどのように確保されていますか?
WAF(Web Application Firewall)によりツールのセキュリティを担保しています。
また、権限やユーザ単位による複雑なログイン認証により不正ログインを防御し、ユーザとファイル情報をもとに一意のキーで管理されているため他ユーザが参照することはできません。

SAINデータプレパレーションをぜひお試しください

本ツールは、私たち自身のAI活用においてデータ前処理が大きなハードルとなっていた経験が開発の発端となっています。

ぜひ、データ前処理を省力化して、コア工程であるモデル生成・検証・チューニングに貴重な時間を割り当ててください。