Spaces:
Running
Running
Remove outdated anchor name sentence embeddings file, update cached embeddings with new sizes, and refactor sub subject and name mapping in the prediction process.
Browse files- data/anchor_name_sentence_embeddings_cl-nagoya-sup-simcse-ja-nss-v_1_0_7_10_float16.pkl +0 -3
- data/cached_embeddings_abstract.pkl +2 -2
- data/cached_embeddings_name.pkl +2 -2
- data/cached_embeddings_unit.pkl +2 -2
- data/nameMapData.csv +0 -0
- data/outputData.csv +0 -0
- data/subSubjectAndNameMapData.csv +1 -40
- data/subSubjectMapData.csv +6 -6
- routes/predict.py +4 -6
- services/sentence_transformer_service.py +12 -19
data/anchor_name_sentence_embeddings_cl-nagoya-sup-simcse-ja-nss-v_1_0_7_10_float16.pkl
DELETED
@@ -1,3 +0,0 @@
|
|
1 |
-
version https://git-lfs.github.com/spec/v1
|
2 |
-
oid sha256:a4689a144a7bb1d3e8dd7f5cfb52a152f001514215b46d59ff2fe61b672bd0de
|
3 |
-
size 11788964
|
|
|
|
|
|
|
|
data/cached_embeddings_abstract.pkl
CHANGED
@@ -1,3 +1,3 @@
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
-
oid sha256:
|
3 |
-
size
|
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:9228f5a3d3a1e87ae1cc3bead894275c1c72f0235db187191d96aefe24519bef
|
3 |
+
size 15165877
|
data/cached_embeddings_name.pkl
CHANGED
@@ -1,3 +1,3 @@
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
-
oid sha256:
|
3 |
-
size
|
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:4ff02d38b5244171b7546bb884be57200d4c20f0fd23fdd7b1d2636ec2f34fce
|
3 |
+
size 31974360
|
data/cached_embeddings_unit.pkl
CHANGED
@@ -1,3 +1,3 @@
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
-
oid sha256:
|
3 |
-
size
|
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:296c8e2fa98330d9f7df7f02f14b1e5e1d8e2a27e2bdfb181a50b8017f67da80
|
3 |
+
size 372392
|
data/nameMapData.csv
CHANGED
The diff for this file is too large to render.
See raw diff
|
|
data/outputData.csv
CHANGED
The diff for this file is too large to render.
See raw diff
|
|
data/subSubjectAndNameMapData.csv
CHANGED
@@ -1,47 +1,8 @@
|
|
1 |
-
|
2 |
地業,工事費,既製コンクリート杭,既製コンクリート杭工事費
|
3 |
地業,杭施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
|
4 |
地業,施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
|
5 |
地業,試験杭施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
|
6 |
-
囲障,囲障手摺,外部,外部 囲障手摺
|
7 |
-
囲障,囲障手摺,内部,内部 囲障手摺
|
8 |
-
既製コンクリート,壁ALC板下り壁下端金物,外部,外壁ALC板下り壁下端金物
|
9 |
-
既製コンクリート,壁ALC板下り壁下端金物,内部,内壁ALC板下り壁下端金物
|
10 |
-
既製コンクリート,壁ALC板足元金物,外部,外壁ALC板足元金物
|
11 |
-
既製コンクリート,壁ALC板足元金物,内部,内壁ALC板足元金物
|
12 |
-
既製コンクリート,壁ALC板開口補強,外部,外壁ALC板開口補強
|
13 |
-
既製コンクリート,壁ALC板開口補強,内部,内壁ALC板開口補強
|
14 |
-
既製コンクリート,壁ALC板取付金物,外部,外壁ALC板取付金物
|
15 |
-
既製コンクリート,壁ALC板取付金物,内部,内壁ALC板取付金物
|
16 |
-
既製コンクリート,壁ALC板頂部金物,外部,外壁ALC板頂部金物
|
17 |
-
既製コンクリート,壁ALC板頂部金物,内部,内壁ALC板頂部金物
|
18 |
-
既製コンクリート,壁押出成形セメント板,外部,外壁押出成形セメント板
|
19 |
-
既製コンクリート,壁押出成形セメント板,内部,内壁押出成形セメント板
|
20 |
-
既製コンクリート,壁押出成形セメント板コーナー金物,外部,外壁押出成形セメント板コーナー金物
|
21 |
-
既製コンクリート,壁押出成形セメント板コーナー金物,内部,内壁押出成形セメント板コーナー金物
|
22 |
-
既製コンクリート,壁押出成形セメント板足元金物,外部,外壁押出成形セメント板足元金物
|
23 |
-
既製コンクリート,壁押出成形セメント板足元金物,内部,内壁押出成形セメント板足元金物
|
24 |
-
既製コンクリート,壁押出成形セメント板開口補強金物,外部,外壁押出成形セメント板開口補強金物
|
25 |
-
既製コンクリート,壁押出成形セメント板開口補強金物,内部,内壁押出成形セメント板開口補強金物
|
26 |
-
既製コンクリート,壁押出成形セメント板取付金物,外部,外壁押出成形セメント板取付金物
|
27 |
-
既製コンクリート,壁押出成形セメント板頂部金物,外部,外壁押出成形セメント板頂部金物
|
28 |
-
既製コンクリート,壁押出成形セメント板頂部金物,内部,内壁押出成形セメント板頂部金物
|
29 |
-
既製コンクリート,壁ALC板,外部,外壁ALC板
|
30 |
-
既製コンクリート,壁ALC板,内部,内壁ALC板
|
31 |
-
既製コンクリート,壁ALC板開口補強金物,外部,外壁ALC板開口補強金物
|
32 |
-
既製コンクリート,壁ALC板開口補強金物,内部,内壁ALC板開口補強金物
|
33 |
-
金属,階段ノンスリップ,外部,外部 階段ノンスリップ
|
34 |
-
金属,階段ノンスリップ,内部,内部 階段ノンスリップ
|
35 |
-
金属,手摺,外部,外部 手摺
|
36 |
-
金属,手摺,内部,内部 手摺
|
37 |
-
金属,仮設手摺,外部,外部 仮設手摺
|
38 |
-
金属,仮設手摺,内部,内部 仮設手摺
|
39 |
-
金属,階段手摺,外部,外部 階段手摺
|
40 |
-
金属,階段手摺,内部,内部 階段手摺
|
41 |
-
金属,階段壁付手摺,外部,外部 階段壁付手摺
|
42 |
-
金属,階段壁付手摺,内部,内部 階段壁付手摺
|
43 |
-
左官,建具防水モルタル充填,外部,外部 建具防水モルタル充填
|
44 |
-
左官,建具防水モルタル充填,内部,内部 建具防水モルタル充填
|
45 |
建具,ガラスドア,ガラスドア(内部),内部 鋼製建具
|
46 |
建具,ガラスドア,ガラスドア(外部),外部 鋼製建具
|
47 |
建具,ガラスドア,ガラス(内部),内部 ガラス
|
|
|
1 |
+
標準科目,入力_項目名,標準中科目,出力_項目名
|
2 |
地業,工事費,既製コンクリート杭,既製コンクリート杭工事費
|
3 |
地業,杭施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
|
4 |
地業,施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
|
5 |
地業,試験杭施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
建具,ガラスドア,ガラスドア(内部),内部 鋼製建具
|
7 |
建具,ガラスドア,ガラスドア(外部),外部 鋼製建具
|
8 |
建具,ガラスドア,ガラス(内部),内部 ガラス
|
data/subSubjectMapData.csv
CHANGED
@@ -60,7 +60,7 @@
|
|
60 |
建具,アルミニウム製建具(運搬取付),アルミニウム製建具(運搬取付),
|
61 |
建具,アルミニウム製建具(外部),アルミニウム製建具(外部),外部
|
62 |
建具,アルミニウム製建具(内部),アルミニウム製建具(内部),内部
|
63 |
-
|
64 |
建具,エンジン装置,自動ドア開閉装置(内部・外部不明),不明
|
65 |
建具,エンジン装置(外部),自動ドア開閉装置(外部),外部
|
66 |
建具,エンジン装置(内部),自動ドア開閉装置(内部),内部
|
@@ -166,8 +166,8 @@
|
|
166 |
鉄筋,その他,その他,
|
167 |
鉄筋,解体,解体,
|
168 |
鉄筋,解体(躯体),解体,
|
169 |
-
|
170 |
-
|
171 |
鉄筋,外部仕上,外部仕上,外部
|
172 |
鉄筋,躯体,躯体,
|
173 |
鉄筋,直接仮設,その他,
|
@@ -180,7 +180,7 @@
|
|
180 |
鉄骨,アルミハニカム庇吊り鉄骨,付帯鉄骨,
|
181 |
鉄骨,キャットウォーク鉄骨,付帯鉄骨,
|
182 |
鉄骨,デッキプレート,デッキプレート,
|
183 |
-
|
184 |
鉄骨,バックスタンド階段鉄骨,付帯鉄骨,
|
185 |
鉄骨,バックスタンド南側トイレ鉄骨,付帯鉄骨,
|
186 |
鉄骨,バックスタンド北側トイレ鉄骨,付帯鉄骨,
|
@@ -197,8 +197,8 @@
|
|
197 |
鉄骨,屋上目隠しフェンス下地鉄骨,付帯鉄骨,
|
198 |
鉄骨,屋内練習場階段鉄骨,付帯鉄骨,
|
199 |
鉄骨,階段鉄骨,付帯鉄骨,
|
200 |
-
|
201 |
-
|
202 |
鉄骨,建具下地鉄骨,付帯鉄骨,
|
203 |
鉄骨,光ダクト下地鉄骨,付帯鉄骨,
|
204 |
鉄骨,勾配屋根下地鉄骨,付帯鉄骨,
|
|
|
60 |
建具,アルミニウム製建具(運搬取付),アルミニウム製建具(運搬取付),
|
61 |
建具,アルミニウム製建具(外部),アルミニウム製建具(外部),外部
|
62 |
建具,アルミニウム製建具(内部),アルミニウム製建具(内部),内部
|
63 |
+
建具,アルミニウム製建具(不明),アルミニウム製建具(運搬取付),
|
64 |
建具,エンジン装置,自動ドア開閉装置(内部・外部不明),不明
|
65 |
建具,エンジン装置(外部),自動ドア開閉装置(外部),外部
|
66 |
建具,エンジン装置(内部),自動ドア開閉装置(内部),内部
|
|
|
166 |
鉄筋,その他,その他,
|
167 |
鉄筋,解体,解体,
|
168 |
鉄筋,解体(躯体),解体,
|
169 |
+
鉄筋,解体(内部),解体(内部),内部
|
170 |
+
鉄筋,解体(外部),解体(外部),外部
|
171 |
鉄筋,外部仕上,外部仕上,外部
|
172 |
鉄筋,躯体,躯体,
|
173 |
鉄筋,直接仮設,その他,
|
|
|
180 |
鉄骨,アルミハニカム庇吊り鉄骨,付帯鉄骨,
|
181 |
鉄骨,キャットウォーク鉄骨,付帯鉄骨,
|
182 |
鉄骨,デッキプレート,デッキプレート,
|
183 |
+
鉄骨,バック-屋内接続鉄骨,付帯鉄骨,
|
184 |
鉄骨,バックスタンド階段鉄骨,付帯鉄骨,
|
185 |
鉄骨,バックスタンド南側トイレ鉄骨,付帯鉄骨,
|
186 |
鉄骨,バックスタンド北側トイレ鉄骨,付帯鉄骨,
|
|
|
197 |
鉄骨,屋上目隠しフェンス下地鉄骨,付帯鉄骨,
|
198 |
鉄骨,屋内練習場階段鉄骨,付帯鉄骨,
|
199 |
鉄骨,階段鉄骨,付帯鉄骨,
|
200 |
+
鉄骨,外部,その他,
|
201 |
+
鉄骨,外部階段鉄骨,付帯鉄骨,
|
202 |
鉄骨,建具下地鉄骨,付帯鉄骨,
|
203 |
鉄骨,光ダクト下地鉄骨,付帯鉄骨,
|
204 |
鉄骨,勾配屋根下地鉄骨,付帯鉄骨,
|
routes/predict.py
CHANGED
@@ -17,7 +17,7 @@ from mapping_lib.standard_subject_data_mapper import StandardSubjectDataMapper
|
|
17 |
from mapping_lib.subject_similarity_mapper import SubjectSimilarityMapper
|
18 |
from mapping_lib.sub_subject_similarity_mapper import SubSubjectSimilarityMapper
|
19 |
from mapping_lib.name_similarity_mapper import NameSimilarityMapper
|
20 |
-
from mapping_lib.
|
21 |
from mapping_lib.abstract_similarity_mapper import AbstractSimilarityMapper
|
22 |
from mapping_lib.name_and_abstract_mapper import NameAndAbstractDataMapper
|
23 |
from mapping_lib.unit_mapper import UnitMapper
|
@@ -160,15 +160,13 @@ async def predict(
|
|
160 |
try:
|
161 |
# Sub subject and name mapping
|
162 |
if sentence_service.df_sub_subject_and_name_map_data is not None:
|
163 |
-
sub_subject_and_name_mapper =
|
164 |
df_map_data=sentence_service.df_sub_subject_and_name_map_data
|
165 |
)
|
166 |
-
|
167 |
-
df_input_data=df_output_data
|
168 |
-
)
|
169 |
|
170 |
except Exception as e:
|
171 |
-
print(f"Error processing
|
172 |
raise HTTPException(status_code=500, detail=str(e))
|
173 |
|
174 |
try:
|
|
|
17 |
from mapping_lib.subject_similarity_mapper import SubjectSimilarityMapper
|
18 |
from mapping_lib.sub_subject_similarity_mapper import SubSubjectSimilarityMapper
|
19 |
from mapping_lib.name_similarity_mapper import NameSimilarityMapper
|
20 |
+
from mapping_lib.sub_subject_and_name_data_mapper import SubSubjectAndNameDataMapper
|
21 |
from mapping_lib.abstract_similarity_mapper import AbstractSimilarityMapper
|
22 |
from mapping_lib.name_and_abstract_mapper import NameAndAbstractDataMapper
|
23 |
from mapping_lib.unit_mapper import UnitMapper
|
|
|
160 |
try:
|
161 |
# Sub subject and name mapping
|
162 |
if sentence_service.df_sub_subject_and_name_map_data is not None:
|
163 |
+
sub_subject_and_name_mapper = SubSubjectAndNameDataMapper(
|
164 |
df_map_data=sentence_service.df_sub_subject_and_name_map_data
|
165 |
)
|
166 |
+
sub_subject_and_name_mapper.map_data(df_input_data=df_output_data)
|
|
|
|
|
167 |
|
168 |
except Exception as e:
|
169 |
+
print(f"Error processing SubSubjectAndNameDataMapper: {e}")
|
170 |
raise HTTPException(status_code=500, detail=str(e))
|
171 |
|
172 |
try:
|
services/sentence_transformer_service.py
CHANGED
@@ -212,6 +212,18 @@ class SentenceTransformerService:
|
|
212 |
self.df_name_map_data = pd.read_csv(name_map_file)
|
213 |
print(f"Loaded name map data: {len(self.df_name_map_data)} entries")
|
214 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
215 |
# Load abstract map data
|
216 |
abstract_map_file = os.path.join(DATA_DIR, "abstractMapData.csv")
|
217 |
if os.path.exists(abstract_map_file):
|
@@ -219,13 +231,6 @@ class SentenceTransformerService:
|
|
219 |
print(
|
220 |
f"Loaded abstract map data: {len(self.df_abstract_map_data)} entries"
|
221 |
)
|
222 |
-
print(
|
223 |
-
f"DEBUG: Abstract map data columns: {list(self.df_abstract_map_data.columns)}"
|
224 |
-
)
|
225 |
-
print(f"DEBUG: Abstract map data sample:")
|
226 |
-
print(self.df_abstract_map_data.head(3).to_string())
|
227 |
-
else:
|
228 |
-
print(f"DEBUG: Abstract map file not found: {abstract_map_file}")
|
229 |
|
230 |
# Load name and subject map data
|
231 |
name_and_subject_map_file = os.path.join(
|
@@ -239,18 +244,6 @@ class SentenceTransformerService:
|
|
239 |
f"Loaded name and subject map data: {len(self.df_name_and_subject_map_data)} entries"
|
240 |
)
|
241 |
|
242 |
-
# Load sub subject and name map data
|
243 |
-
sub_subject_and_name_map_file = os.path.join(
|
244 |
-
DATA_DIR, "subSubjectAndNameMapData.csv"
|
245 |
-
)
|
246 |
-
if os.path.exists(sub_subject_and_name_map_file):
|
247 |
-
self.df_sub_subject_and_name_map_data = pd.read_csv(
|
248 |
-
sub_subject_and_name_map_file
|
249 |
-
)
|
250 |
-
print(
|
251 |
-
f"Loaded sub subject and name map data: {len(self.df_sub_subject_and_name_map_data)} entries"
|
252 |
-
)
|
253 |
-
|
254 |
except Exception as e:
|
255 |
print(f"Error loading map data: {e}")
|
256 |
|
|
|
212 |
self.df_name_map_data = pd.read_csv(name_map_file)
|
213 |
print(f"Loaded name map data: {len(self.df_name_map_data)} entries")
|
214 |
|
215 |
+
# Load sub subject and name map data
|
216 |
+
sub_subject_and_name_map_file = os.path.join(
|
217 |
+
DATA_DIR, "subSubjectAndNameMapData.csv"
|
218 |
+
)
|
219 |
+
if os.path.exists(sub_subject_and_name_map_file):
|
220 |
+
self.df_sub_subject_and_name_map_data = pd.read_csv(
|
221 |
+
sub_subject_and_name_map_file
|
222 |
+
)
|
223 |
+
print(
|
224 |
+
f"Loaded sub subject and name map data: {len(self.df_sub_subject_and_name_map_data)} entries"
|
225 |
+
)
|
226 |
+
|
227 |
# Load abstract map data
|
228 |
abstract_map_file = os.path.join(DATA_DIR, "abstractMapData.csv")
|
229 |
if os.path.exists(abstract_map_file):
|
|
|
231 |
print(
|
232 |
f"Loaded abstract map data: {len(self.df_abstract_map_data)} entries"
|
233 |
)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
234 |
|
235 |
# Load name and subject map data
|
236 |
name_and_subject_map_file = os.path.join(
|
|
|
244 |
f"Loaded name and subject map data: {len(self.df_name_and_subject_map_data)} entries"
|
245 |
)
|
246 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
247 |
except Exception as e:
|
248 |
print(f"Error loading map data: {e}")
|
249 |
|