update db
This commit is contained in:
parent
1d655d32ef
commit
fbd872a40a
2 changed files with 4 additions and 2 deletions
|
|
@ -966,7 +966,7 @@ zwimel
|
||||||
ابو فص
|
ابو فص
|
||||||
ابو قرعة
|
ابو قرعة
|
||||||
اتن
|
اتن
|
||||||
احا
|
*احا*
|
||||||
احترم نفسك
|
احترم نفسك
|
||||||
احتلام
|
احتلام
|
||||||
احلي كث
|
احلي كث
|
||||||
|
|
@ -1275,10 +1275,11 @@ zwimel
|
||||||
نكت امه
|
نكت امه
|
||||||
نياكة
|
نياكة
|
||||||
نياكه
|
نياكه
|
||||||
نيك
|
*نيك*
|
||||||
واطي
|
واطي
|
||||||
وسخ
|
وسخ
|
||||||
ولد القحبة
|
ولد القحبة
|
||||||
ولد القحبه
|
ولد القحبه
|
||||||
يا هبيلة
|
يا هبيلة
|
||||||
يلعن
|
يلعن
|
||||||
|
*كس*
|
||||||
|
|
@ -43,6 +43,7 @@ class Wiqaya:
|
||||||
return text
|
return text
|
||||||
|
|
||||||
def _process(self, text: str) -> list[str]:
|
def _process(self, text: str) -> list[str]:
|
||||||
|
# حذف التشكيل من الكلمات العربية لتجنب التحايل
|
||||||
if self.lang == "ar":
|
if self.lang == "ar":
|
||||||
text = remove_tashkeel(text)
|
text = remove_tashkeel(text)
|
||||||
return text.lower().split()
|
return text.lower().split()
|
||||||
Loading…
Add table
Reference in a new issue