Spaces:
Running
Running
Bor Hodošček
commited on
chore: improve wording
Browse files
app.py
CHANGED
@@ -241,7 +241,7 @@ def intro():
|
|
241 |
2つの異なるカテゴリのテキストファイル群をアップロードし、その差異をScattertextで可視化します。
|
242 |
オプショナルで機械学習モデルで分類をし、モデルの分類制度とモデルが識別に用いるトークンも確認できます。
|
243 |
|
244 |
-
> 会話文認識機能はStandardEbooks
|
245 |
|
246 |
## ワークフロー
|
247 |
|
@@ -249,9 +249,10 @@ def intro():
|
|
249 |
2. データ内容を確認・修正
|
250 |
3. チャンク&サンプリング設定
|
251 |
4. Scattertextによる可視化
|
252 |
-
5.
|
|
|
253 |
|
254 |
-
> 単語分割には、[spaCy](https://spacy.io/)
|
255 |
"""
|
256 |
)
|
257 |
return
|
|
|
241 |
2つの異なるカテゴリのテキストファイル群をアップロードし、その差異をScattertextで可視化します。
|
242 |
オプショナルで機械学習モデルで分類をし、モデルの分類制度とモデルが識別に用いるトークンも確認できます。
|
243 |
|
244 |
+
> 会話文認識機能はStandardEbooks独自のフォーマットに依存するため、他の資料には対応しないことがあります。
|
245 |
|
246 |
## ワークフロー
|
247 |
|
|
|
249 |
2. データ内容を確認・修正
|
250 |
3. チャンク&サンプリング設定
|
251 |
4. Scattertextによる可視化
|
252 |
+
5. PCAのbiplot, 階層的クラスタリングのデンドログラムでサンプルの分布と素性の関係を観察
|
253 |
+
6. 気になるサンプルをドロップダウンで選択し、内容を確認
|
254 |
|
255 |
+
> 単語分割には、[spaCy](https://spacy.io/)([en_core_web_sm](https://spacy.io/models/en#en_core_web_sm)モデル)を使用しています。
|
256 |
"""
|
257 |
)
|
258 |
return
|