blueradiance commited on
Commit
69bf182
·
verified ·
1 Parent(s): b3fa88f

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +46 -13
app.py CHANGED
@@ -44,10 +44,29 @@ def extract_names(text):
44
  names.append(name)
45
 
46
  title_suffixes = [
47
- '대표', '이사', '전무', '상무', '부장', '차장', '과장', '대리', '사원', '실장', '팀장', '소장', '국장', '본부장',
48
- '선생님', '교사', '교장', '교감', '부교장', '조교수', '교수', '연구원', '박사', '석사', '학사',
49
- '학생', '고등학생', '중학생', '초등학생', '학부모', '수험생',
50
- '주임', '총무', '회장', '부회장', '사무장', '간호사', '의사', '원장', '기사님', '매니저', '지점장'
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
51
  ]
52
  pattern = r'\b([가-힣]{2,4})(' + '|'.join(title_suffixes) + r')\b'
53
  matches = re.findall(pattern, text)
@@ -57,15 +76,29 @@ def extract_names(text):
57
  names.append(name)
58
 
59
  honorific_suffixes = [
60
- '어머니', '아버지', '엄마', '아빠', '할머니', '할아버지', '외할머니', '외할아버지',
61
- '', '누나', '언니', '오빠', '동생', '아들', '',
62
- '이모', '고모', '삼촌', '숙모', '외삼촌', '고모부', '이모부', '조카', '사촌',
63
- '남편', '아내', '부인', '와이프', '신랑', '장모', '장인', '사위', '며느리',
64
- '올케', '형수', '제수씨', '매형', '처제', '시누이',
65
- '대표', '사장', '부장', '차장', '과장', '대리', '주임', '직원', '팀장', '실장', '원장', '이사',
66
- '선생님', '선생', '교사', '교장', '교감', '조교수', '교수', '연구원', '강사', '학부모',
67
- '학생', '수험생', '초등학생', '중학생', '고등학생',
68
- '의사', '간호사', '간병인', '보호자', '피해자', '당사자', '대상자', '주민'
 
 
 
 
 
 
 
 
 
 
 
 
 
 
69
  ]
70
  spaced_pattern = r'\b([가-힣]{2,4})\s+(' + '|'.join(honorific_suffixes) + r')\b'
71
  spaced_matches = re.findall(spaced_pattern, text)
 
44
  names.append(name)
45
 
46
  title_suffixes = [
47
+ # 직함/직책
48
+ '대표', '이사', '전무', '상무', '부장', '차장', '과장', '대리', '사원',
49
+ '실장', '팀장', '소장', '국장', '본부장', '주임', '총무', '회장', '부회장', '사무장',
50
+ '직원', '매니저', '지점장',
51
+
52
+ # 교육 관련
53
+ '선생님', '선생', '교사', '교장', '교감', '부교장', '조교수', '교수', '연구원', '강사',
54
+
55
+ # 학위/전문가
56
+ '박사', '석사', '학사', '의사', '간호사', '간병인',
57
+
58
+ # 학생 관련
59
+ '학생', '수험생', '초등학생', '중학생', '고등학생', '학부모',
60
+
61
+ # 가족/친척
62
+ '어머니', '아버지', '엄마', '아빠', '형', '누나', '언니', '오빠', '동생',
63
+ '아들', '딸', '할머니', '할아버지', '외할머니', '외할아버지',
64
+ '이모', '고모', '삼촌', '숙모', '외삼촌', '고모부', '이모부', '조카', '사촌',
65
+ '남편', '아내', '부인', '와이프', '신랑', '장모', '장인', '사위', '며느리',
66
+ '올케', '형수', '제수씨', '매형', '처제', '시누이',
67
+
68
+ # 그 외 지칭
69
+ '보호자', '피해자', '당사자', '대상자', '주민', '어르신', '기사님'
70
  ]
71
  pattern = r'\b([가-힣]{2,4})(' + '|'.join(title_suffixes) + r')\b'
72
  matches = re.findall(pattern, text)
 
76
  names.append(name)
77
 
78
  honorific_suffixes = [
79
+ # 직함/직책
80
+ '대표', '이사', '전무', '상무', '부장', '차장', '과장', '대리', '사원',
81
+ '실장', '팀장', '소장', '국장', '본부장', '주임', '총무', '회장', '부회장', '사무장',
82
+ '직원', '매니저', '지점장',
83
+
84
+ # 교육 관련
85
+ '선생님', '선생', '교사', '교장', '교감', '부교장', '조교수', '교수', '연구원', '강사',
86
+
87
+ # 학위/전문가
88
+ '박사', '석사', '학사', '의사', '간호사', '간병인',
89
+
90
+ # 학생 관련
91
+ '학생', '수험생', '초등학생', '중학생', '고등학생', '학부모',
92
+
93
+ # 가족/친척
94
+ '어머니', '아버지', '엄마', '아빠', '형', '누나', '언니', '오빠', '동생',
95
+ '아들', '딸', '할머니', '할아버지', '외할머니', '외할아버지',
96
+ '이모', '고모', '삼촌', '숙모', '외삼촌', '고모부', '이모부', '조카', '사촌',
97
+ '남편', '아내', '부인', '와이프', '신랑', '장모', '장인', '사위', '며느리',
98
+ '올케', '형수', '제수씨', '매형', '처제', '시누이',
99
+
100
+ # 그 외 지칭
101
+ '보호자', '피해자', '당사자', '대상자', '주민', '어르신', '기사님'
102
  ]
103
  spaced_pattern = r'\b([가-힣]{2,4})\s+(' + '|'.join(honorific_suffixes) + r')\b'
104
  spaced_matches = re.findall(spaced_pattern, text)