Skip to content

Commit

Permalink
Steps
Browse files Browse the repository at this point in the history
  • Loading branch information
emircanerol authored Aug 18, 2022
1 parent 8bfc6b9 commit 5142807
Showing 1 changed file with 5 additions and 0 deletions.
5 changes: 5 additions & 0 deletions README.md
Original file line number Diff line number Diff line change
@@ -1,2 +1,7 @@
# Lexlata
Kamuda mevzuat arama motoru

- Öncelikle doc2vec ve tf-idf modellerini denedik ve projemizin temelini attık, sonrasında BERT modelinin başarımının yüksek olması nedeniyle BERT modelini kullanmaya karar verdik.
- BERT modelini eğitmek çok fazla kaynak gerektirdiğinden önceden eğitilmiş bir modeli (https://huggingface.co/dbmdz/bert-base-turkish-cased) temel aldık.
- BERT modelini bize verilen ve mevzuat.gov.tr sitesinden çektiğimiz veriyle eğittik.
- Elde ettiğimiz kelime temsillerini kosinüs benzerliği kullanarak karşılaştırarak en benzer sonucu elde etmeye çalıştık.

0 comments on commit 5142807

Please sign in to comment.