You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: udapi/block/ud/cs/fixedeprels.py
+10Lines changed: 10 additions & 0 deletions
Original file line number
Diff line number
Diff line change
@@ -38,6 +38,7 @@ class FixEdeprels(Block):
38
38
# case. And include all other prepositions that have unambiguous morphological
39
39
# case, even if they are not secondary.
40
40
unambiguous= {
41
+
'á': 'na:acc', # "á konto té záležitosti", ovšem "á konto" není ani spojeno jako složená předložka (význam = "na konto")
41
42
'abi': 'aby',
42
43
'aby_na': 'na:loc',
43
44
'ačkoliv': 'ačkoli',
@@ -59,6 +60,7 @@ class FixEdeprels(Block):
59
60
'bez_zřetel_k': 'bez_zřetele_k:dat',
60
61
'bez_zřetel_na': 'bez_zřetele_na:acc',
61
62
'blízko': 'blízko:dat',
63
+
'blízko_k': 'blízko:dat',
62
64
'blíž': 'blízko:dat',
63
65
'cesta': 'cestou:gen',
64
66
'coby': 'coby', # remove morphological case
@@ -86,6 +88,8 @@ class FixEdeprels(Block):
86
88
'jakoby_pod': 'pod:ins',
87
89
'jakožto': 'jako',
88
90
'jelikož_do': 'jelikož',
91
+
'jenom': 'jen',
92
+
'jesli': 'jestli',
89
93
'jestli_že': 'jestliže',
90
94
'k': 'k:dat',
91
95
'k_konec': 'ke_konci:gen',
@@ -98,6 +102,7 @@ class FixEdeprels(Block):
98
102
'konec': 'koncem:gen',
99
103
'krom': 'kromě:gen',
100
104
'kromě': 'kromě:gen',
105
+
'leda_když': 'ledaže',
101
106
'li_jako': 'li',
102
107
'liž': 'li',
103
108
'mezi_uvnitř': 'uvnitř:gen',
@@ -131,6 +136,7 @@ class FixEdeprels(Block):
131
136
'o_jako': 'jako',
132
137
'o_o': 'o:acc',
133
138
'od': 'od:gen',
139
+
'od_počínaje': 'počínaje:ins', # od brambor počínaje a základní zeleninou konče
134
140
'ohledně': 'ohledně:gen',
135
141
'okolo': 'okolo:gen',
136
142
'oproti': 'oproti:dat',
@@ -162,6 +168,7 @@ class FixEdeprels(Block):
162
168
'před_během': 'během:gen', # před a během utkání
163
169
'před_po': 'po:loc', # před a po vyloučení Schindlera
164
170
'přes': 'přes:acc',
171
+
'přes_přes': 'přes:acc', # annotation error
165
172
'přestože': 'přestože', # remove morphological case
166
173
'při': 'při:loc',
167
174
'při_pro': 'při:loc',
@@ -183,6 +190,7 @@ class FixEdeprels(Block):
183
190
'směr_k': 'směrem_k:dat',
184
191
'směr_na': 'směrem_na:acc',
185
192
'směr_od': 'směrem_od:gen',
193
+
'směr_přes': 'směrem_přes:acc',
186
194
'společně_s': 'společně_s:ins',
187
195
'spolu': 'spolu_s:ins',
188
196
'spolu_s': 'spolu_s:ins',
@@ -233,6 +241,7 @@ class FixEdeprels(Block):
233
241
'v_služba': 've_službách:gen',
234
242
'v_směr': 've_směru:gen',
235
243
'v_směr_k': 've_směru_k:dat',
244
+
'v_směr_na': 've_směru_k:dat', # same meaning as ve_směru_na:acc
236
245
'v_smysl': 've_smyslu:gen',
237
246
'v_součinnost_s': 'v_součinnosti_s:ins',
238
247
'v_souhlas_s': 'v_souhlasu_s:ins',
@@ -319,6 +328,7 @@ def process_node(self, node):
319
328
# flagged as solved.
320
329
edep['deprel'] =re.sub(r'^advcl:do(?::gen)?$', r'obl:do:gen', edep['deprel']) # od nevidím do nevidím ###!!! Ale měli bychom opravit i závislost v základním stromu!
321
330
edep['deprel'] =re.sub(r'^advcl:pro(?::acc)?$', r'advcl:aby', edep['deprel']) # byl by pro, abychom... ###!!! Opravit i konverzi stromu.
331
+
edep['deprel'] =re.sub(r'^advcl:s(?::ins)?$', r'advcl', edep['deprel']) ###!!! "seděli jsme tam s Člověče, nezlob se!" Měla by se opravit konverze stromu.
0 commit comments