Bor Hodošček commited on
Commit
a9ceef6
·
unverified ·
1 Parent(s): d479194

chore: improve wording

Browse files
Files changed (1) hide show
  1. app.py +4 -3
app.py CHANGED
@@ -241,7 +241,7 @@ def intro():
241
  2つの異なるカテゴリのテキストファイル群をアップロードし、その差異をScattertextで可視化します。
242
  オプショナルで機械学習モデルで分類をし、モデルの分類制度とモデルが識別に用いるトークンも確認できます。
243
 
244
- > 会話文認識機能はStandardEbooks独自のフォーマットに依存するため、他の資料には対応しないことがある。
245
 
246
  ## ワークフロー
247
 
@@ -249,9 +249,10 @@ def intro():
249
  2. データ内容を確認・修正
250
  3. チャンク&サンプリング設定
251
  4. Scattertextによる可視化
252
- 5. (任意)分類モデルによる性能検証
 
253
 
254
- > 単語分割には、[spaCy](https://spacy.io/)を使用しています。
255
  """
256
  )
257
  return
 
241
  2つの異なるカテゴリのテキストファイル群をアップロードし、その差異をScattertextで可視化します。
242
  オプショナルで機械学習モデルで分類をし、モデルの分類制度とモデルが識別に用いるトークンも確認できます。
243
 
244
+ > 会話文認識機能はStandardEbooks独自のフォーマットに依存するため、他の資料には対応しないことがあります。
245
 
246
  ## ワークフロー
247
 
 
249
  2. データ内容を確認・修正
250
  3. チャンク&サンプリング設定
251
  4. Scattertextによる可視化
252
+ 5. PCAのbiplot, 階層的クラスタリングのデンドログラムでサンプルの分布と素性の関係を観察
253
+ 6. 気になるサンプルをドロップダウンで選択し、内容を確認
254
 
255
+ > 単語分割には、[spaCy](https://spacy.io/)([en_core_web_sm](https://spacy.io/models/en#en_core_web_sm)モデル)を使用しています。
256
  """
257
  )
258
  return