vumichien commited on
Commit
dfb55d0
·
1 Parent(s): ab43a9d

Remove outdated anchor name sentence embeddings file, update cached embeddings with new sizes, and refactor sub subject and name mapping in the prediction process.

Browse files
data/anchor_name_sentence_embeddings_cl-nagoya-sup-simcse-ja-nss-v_1_0_7_10_float16.pkl DELETED
@@ -1,3 +0,0 @@
1
- version https://git-lfs.github.com/spec/v1
2
- oid sha256:a4689a144a7bb1d3e8dd7f5cfb52a152f001514215b46d59ff2fe61b672bd0de
3
- size 11788964
 
 
 
 
data/cached_embeddings_abstract.pkl CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:58ad58db3d865a942112608f5c5cc39e0f01338546b8c6facafcefcf594f8ff8
3
- size 15169072
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:9228f5a3d3a1e87ae1cc3bead894275c1c72f0235db187191d96aefe24519bef
3
+ size 15165877
data/cached_embeddings_name.pkl CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:ab971dce60371e86a457946880f73cce60b1eb70211ed793f341530a406af15b
3
- size 31974400
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:4ff02d38b5244171b7546bb884be57200d4c20f0fd23fdd7b1d2636ec2f34fce
3
+ size 31974360
data/cached_embeddings_unit.pkl CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:917d6d46ef5e75ddca3f081169eb9f9323eab50dbed95583037907c26c855ae0
3
- size 734106
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:296c8e2fa98330d9f7df7f02f14b1e5e1d8e2a27e2bdfb181a50b8017f67da80
3
+ size 372392
data/nameMapData.csv CHANGED
The diff for this file is too large to render. See raw diff
 
data/outputData.csv CHANGED
The diff for this file is too large to render. See raw diff
 
data/subSubjectAndNameMapData.csv CHANGED
@@ -1,47 +1,8 @@
1
- 標準科目,標準名称,標準中科目,出力_標準名称
2
  地業,工事費,既製コンクリート杭,既製コンクリート杭工事費
3
  地業,杭施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
4
  地業,施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
5
  地業,試験杭施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
6
- 囲障,囲障手摺,外部,外部 囲障手摺
7
- 囲障,囲障手摺,内部,内部 囲障手摺
8
- 既製コンクリート,壁ALC板下り壁下端金物,外部,外壁ALC板下り壁下端金物
9
- 既製コンクリート,壁ALC板下り壁下端金物,内部,内壁ALC板下り壁下端金物
10
- 既製コンクリート,壁ALC板足元金物,外部,外壁ALC板足元金物
11
- 既製コンクリート,壁ALC板足元金物,内部,内壁ALC板足元金物
12
- 既製コンクリート,壁ALC板開口補強,外部,外壁ALC板開口補強
13
- 既製コンクリート,壁ALC板開口補強,内部,内壁ALC板開口補強
14
- 既製コンクリート,壁ALC板取付金物,外部,外壁ALC板取付金物
15
- 既製コンクリート,壁ALC板取付金物,内部,内壁ALC板取付金物
16
- 既製コンクリート,壁ALC板頂部金物,外部,外壁ALC板頂部金物
17
- 既製コンクリート,壁ALC板頂部金物,内部,内壁ALC板頂部金物
18
- 既製コンクリート,壁押出成形セメント板,外部,外壁押出成形セメント板
19
- 既製コンクリート,壁押出成形セメント板,内部,内壁押出成形セメント板
20
- 既製コンクリート,壁押出成形セメント板コーナー金物,外部,外壁押出成形セメント板コーナー金物
21
- 既製コンクリート,壁押出成形セメント板コーナー金物,内部,内壁押出成形セメント板コーナー金物
22
- 既製コンクリート,壁押出成形セメント板足元金物,外部,外壁押出成形セメント板足元金物
23
- 既製コンクリート,壁押出成形セメント板足元金物,内部,内壁押出成形セメント板足元金物
24
- 既製コンクリート,壁押出成形セメント板開口補強金物,外部,外壁押出成形セメント板開口補強金物
25
- 既製コンクリート,壁押出成形セメント板開口補強金物,内部,内壁押出成形セメント板開口補強金物
26
- 既製コンクリート,壁押出成形セメント板取付金物,外部,外壁押出成形セメント板取付金物
27
- 既製コンクリート,壁押出成形セメント板頂部金物,外部,外壁押出成形セメント板頂部金物
28
- 既製コンクリート,壁押出成形セメント板頂部金物,内部,内壁押出成形セメント板頂部金物
29
- 既製コンクリート,壁ALC板,外部,外壁ALC板
30
- 既製コンクリート,壁ALC板,内部,内壁ALC板
31
- 既製コンクリート,壁ALC板開口補強金物,外部,外壁ALC板開口補強金物
32
- 既製コンクリート,壁ALC板開口補強金物,内部,内壁ALC板開口補強金物
33
- 金属,階段ノンスリップ,外部,外部 階段ノンスリップ
34
- 金属,階段ノンスリップ,内部,内部 階段ノンスリップ
35
- 金属,手摺,外部,外部 手摺
36
- 金属,手摺,内部,内部 手摺
37
- 金属,仮設手摺,外部,外部 仮設手摺
38
- 金属,仮設手摺,内部,内部 仮設手摺
39
- 金属,階段手摺,外部,外部 階段手摺
40
- 金属,階段手摺,内部,内部 階段手摺
41
- 金属,階段壁付手摺,外部,外部 階段壁付手摺
42
- 金属,階段壁付手摺,内部,内部 階段壁付手摺
43
- 左官,建具防水モルタル充填,外部,外部 建具防水モルタル充填
44
- 左官,建具防水モルタル充填,内部,内部 建具防水モルタル充填
45
  建具,ガラスドア,ガラスドア(内部),内部 鋼製建具
46
  建具,ガラスドア,ガラスドア(外部),外部 鋼製建具
47
  建具,ガラスドア,ガラス(内部),内部 ガラス
 
1
+ 標準科目,入力_項目名,標準中科目,出力_項目名
2
  地業,工事費,既製コンクリート杭,既製コンクリート杭工事費
3
  地業,杭施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
4
  地業,施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
5
  地業,試験杭施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
6
  建具,ガラスドア,ガラスドア(内部),内部 鋼製建具
7
  建具,ガラスドア,ガラスドア(外部),外部 鋼製建具
8
  建具,ガラスドア,ガラス(内部),内部 ガラス
data/subSubjectMapData.csv CHANGED
@@ -60,7 +60,7 @@
60
  建具,アルミニウム製建具(運搬取付),アルミニウム製建具(運搬取付),
61
  建具,アルミニウム製建具(外部),アルミニウム製建具(外部),外部
62
  建具,アルミニウム製建具(内部),アルミニウム製建具(内部),内部
63
- 建具,アルミニウム製建具(不明),アルミニウム製建具(運搬取付),不明
64
  建具,エンジン装置,自動ドア開閉装置(内部・外部不明),不明
65
  建具,エンジン装置(外部),自動ドア開閉装置(外部),外部
66
  建具,エンジン装置(内部),自動ドア開閉装置(内部),内部
@@ -166,8 +166,8 @@
166
  鉄筋,その他,その他,
167
  鉄筋,解体,解体,
168
  鉄筋,解体(躯体),解体,
169
- 鉄筋,解体(内部),解体,内部
170
- 鉄筋,解体(外部),解体,外部
171
  鉄筋,外部仕上,外部仕上,外部
172
  鉄筋,躯体,躯体,
173
  鉄筋,直接仮設,その他,
@@ -180,7 +180,7 @@
180
  鉄骨,アルミハニカム庇吊り鉄骨,付帯鉄骨,
181
  鉄骨,キャットウォーク鉄骨,付帯鉄骨,
182
  鉄骨,デッキプレート,デッキプレート,
183
- 鉄骨,バック-屋内接続鉄骨,付帯鉄骨,内部
184
  鉄骨,バックスタンド階段鉄骨,付帯鉄骨,
185
  鉄骨,バックスタンド南側トイレ鉄骨,付帯鉄骨,
186
  鉄骨,バックスタンド北側トイレ鉄骨,付帯鉄骨,
@@ -197,8 +197,8 @@
197
  鉄骨,屋上目隠しフェンス下地鉄骨,付帯鉄骨,
198
  鉄骨,屋内練習場階段鉄骨,付帯鉄骨,
199
  鉄骨,階段鉄骨,付帯鉄骨,
200
- 鉄骨,外部,付帯鉄骨,外部
201
- 鉄骨,外部階段鉄骨,付帯鉄骨,外部
202
  鉄骨,建具下地鉄骨,付帯鉄骨,
203
  鉄骨,光ダクト下地鉄骨,付帯鉄骨,
204
  鉄骨,勾配屋根下地鉄骨,付帯鉄骨,
 
60
  建具,アルミニウム製建具(運搬取付),アルミニウム製建具(運搬取付),
61
  建具,アルミニウム製建具(外部),アルミニウム製建具(外部),外部
62
  建具,アルミニウム製建具(内部),アルミニウム製建具(内部),内部
63
+ 建具,アルミニウム製建具(不明),アルミニウム製建具(運搬取付),
64
  建具,エンジン装置,自動ドア開閉装置(内部・外部不明),不明
65
  建具,エンジン装置(外部),自動ドア開閉装置(外部),外部
66
  建具,エンジン装置(内部),自動ドア開閉装置(内部),内部
 
166
  鉄筋,その他,その他,
167
  鉄筋,解体,解体,
168
  鉄筋,解体(躯体),解体,
169
+ 鉄筋,解体(内部),解体(内部),内部
170
+ 鉄筋,解体(外部),解体(外部),外部
171
  鉄筋,外部仕上,外部仕上,外部
172
  鉄筋,躯体,躯体,
173
  鉄筋,直接仮設,その他,
 
180
  鉄骨,アルミハニカム庇吊り鉄骨,付帯鉄骨,
181
  鉄骨,キャットウォーク鉄骨,付帯鉄骨,
182
  鉄骨,デッキプレート,デッキプレート,
183
+ 鉄骨,バック-屋内接続鉄骨,付帯鉄骨,
184
  鉄骨,バックスタンド階段鉄骨,付帯鉄骨,
185
  鉄骨,バックスタンド南側トイレ鉄骨,付帯鉄骨,
186
  鉄骨,バックスタンド北側トイレ鉄骨,付帯鉄骨,
 
197
  鉄骨,屋上目隠しフェンス下地鉄骨,付帯鉄骨,
198
  鉄骨,屋内練習場階段鉄骨,付帯鉄骨,
199
  鉄骨,階段鉄骨,付帯鉄骨,
200
+ 鉄骨,外部,その他,
201
+ 鉄骨,外部階段鉄骨,付帯鉄骨,
202
  鉄骨,建具下地鉄骨,付帯鉄骨,
203
  鉄骨,光ダクト下地鉄骨,付帯鉄骨,
204
  鉄骨,勾配屋根下地鉄骨,付帯鉄骨,
routes/predict.py CHANGED
@@ -17,7 +17,7 @@ from mapping_lib.standard_subject_data_mapper import StandardSubjectDataMapper
17
  from mapping_lib.subject_similarity_mapper import SubjectSimilarityMapper
18
  from mapping_lib.sub_subject_similarity_mapper import SubSubjectSimilarityMapper
19
  from mapping_lib.name_similarity_mapper import NameSimilarityMapper
20
- from mapping_lib.name_and_sub_subject_mapper import NameAndSubSubjectDataMapper
21
  from mapping_lib.abstract_similarity_mapper import AbstractSimilarityMapper
22
  from mapping_lib.name_and_abstract_mapper import NameAndAbstractDataMapper
23
  from mapping_lib.unit_mapper import UnitMapper
@@ -160,15 +160,13 @@ async def predict(
160
  try:
161
  # Sub subject and name mapping
162
  if sentence_service.df_sub_subject_and_name_map_data is not None:
163
- sub_subject_and_name_mapper = NameAndSubSubjectDataMapper(
164
  df_map_data=sentence_service.df_sub_subject_and_name_map_data
165
  )
166
- df_output_data = sub_subject_and_name_mapper.map_data(
167
- df_input_data=df_output_data
168
- )
169
 
170
  except Exception as e:
171
- print(f"Error processing NameAndSubSubjectDataMapper: {e}")
172
  raise HTTPException(status_code=500, detail=str(e))
173
 
174
  try:
 
17
  from mapping_lib.subject_similarity_mapper import SubjectSimilarityMapper
18
  from mapping_lib.sub_subject_similarity_mapper import SubSubjectSimilarityMapper
19
  from mapping_lib.name_similarity_mapper import NameSimilarityMapper
20
+ from mapping_lib.sub_subject_and_name_data_mapper import SubSubjectAndNameDataMapper
21
  from mapping_lib.abstract_similarity_mapper import AbstractSimilarityMapper
22
  from mapping_lib.name_and_abstract_mapper import NameAndAbstractDataMapper
23
  from mapping_lib.unit_mapper import UnitMapper
 
160
  try:
161
  # Sub subject and name mapping
162
  if sentence_service.df_sub_subject_and_name_map_data is not None:
163
+ sub_subject_and_name_mapper = SubSubjectAndNameDataMapper(
164
  df_map_data=sentence_service.df_sub_subject_and_name_map_data
165
  )
166
+ sub_subject_and_name_mapper.map_data(df_input_data=df_output_data)
 
 
167
 
168
  except Exception as e:
169
+ print(f"Error processing SubSubjectAndNameDataMapper: {e}")
170
  raise HTTPException(status_code=500, detail=str(e))
171
 
172
  try:
services/sentence_transformer_service.py CHANGED
@@ -212,6 +212,18 @@ class SentenceTransformerService:
212
  self.df_name_map_data = pd.read_csv(name_map_file)
213
  print(f"Loaded name map data: {len(self.df_name_map_data)} entries")
214
 
 
 
 
 
 
 
 
 
 
 
 
 
215
  # Load abstract map data
216
  abstract_map_file = os.path.join(DATA_DIR, "abstractMapData.csv")
217
  if os.path.exists(abstract_map_file):
@@ -219,13 +231,6 @@ class SentenceTransformerService:
219
  print(
220
  f"Loaded abstract map data: {len(self.df_abstract_map_data)} entries"
221
  )
222
- print(
223
- f"DEBUG: Abstract map data columns: {list(self.df_abstract_map_data.columns)}"
224
- )
225
- print(f"DEBUG: Abstract map data sample:")
226
- print(self.df_abstract_map_data.head(3).to_string())
227
- else:
228
- print(f"DEBUG: Abstract map file not found: {abstract_map_file}")
229
 
230
  # Load name and subject map data
231
  name_and_subject_map_file = os.path.join(
@@ -239,18 +244,6 @@ class SentenceTransformerService:
239
  f"Loaded name and subject map data: {len(self.df_name_and_subject_map_data)} entries"
240
  )
241
 
242
- # Load sub subject and name map data
243
- sub_subject_and_name_map_file = os.path.join(
244
- DATA_DIR, "subSubjectAndNameMapData.csv"
245
- )
246
- if os.path.exists(sub_subject_and_name_map_file):
247
- self.df_sub_subject_and_name_map_data = pd.read_csv(
248
- sub_subject_and_name_map_file
249
- )
250
- print(
251
- f"Loaded sub subject and name map data: {len(self.df_sub_subject_and_name_map_data)} entries"
252
- )
253
-
254
  except Exception as e:
255
  print(f"Error loading map data: {e}")
256
 
 
212
  self.df_name_map_data = pd.read_csv(name_map_file)
213
  print(f"Loaded name map data: {len(self.df_name_map_data)} entries")
214
 
215
+ # Load sub subject and name map data
216
+ sub_subject_and_name_map_file = os.path.join(
217
+ DATA_DIR, "subSubjectAndNameMapData.csv"
218
+ )
219
+ if os.path.exists(sub_subject_and_name_map_file):
220
+ self.df_sub_subject_and_name_map_data = pd.read_csv(
221
+ sub_subject_and_name_map_file
222
+ )
223
+ print(
224
+ f"Loaded sub subject and name map data: {len(self.df_sub_subject_and_name_map_data)} entries"
225
+ )
226
+
227
  # Load abstract map data
228
  abstract_map_file = os.path.join(DATA_DIR, "abstractMapData.csv")
229
  if os.path.exists(abstract_map_file):
 
231
  print(
232
  f"Loaded abstract map data: {len(self.df_abstract_map_data)} entries"
233
  )
 
 
 
 
 
 
 
234
 
235
  # Load name and subject map data
236
  name_and_subject_map_file = os.path.join(
 
244
  f"Loaded name and subject map data: {len(self.df_name_and_subject_map_data)} entries"
245
  )
246
 
 
 
 
 
 
 
 
 
 
 
 
 
247
  except Exception as e:
248
  print(f"Error loading map data: {e}")
249