Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[rojak-analyzer] Skor sentimen #138

Open
pyk opened this issue Oct 26, 2016 · 5 comments
Open

[rojak-analyzer] Skor sentimen #138

pyk opened this issue Oct 26, 2016 · 5 comments

Comments

@pyk
Copy link
Owner

pyk commented Oct 26, 2016

Regarding #126

Disini kita mau diskusikan tentang skor sentiment nya. Untuk rojak-analyzer sekarang skor yang kita dapet dari rojak itu seberapa yakin (confident score) saat dia nentuin sentiment nya.

Mungkin dari sisi user kita malah pangen tau sih: dari scale -5 ke 5, seberapa positif atau negatif sih berita ini?

Cara nentuin skornya gimana ya? apa simply kita pake bag-of-words untuk polarity score?

@pyk pyk added this to the Rojak v1.0.0 milestone Oct 26, 2016
@pyk
Copy link
Owner Author

pyk commented Oct 26, 2016

Kita juga bisa pake model regresi untuk ini sih, tapi ya gitu kita perlu data training haha

@girikuncoro
Copy link
Contributor

girikuncoro commented Oct 27, 2016

@pyk hmm kalo dari sisi user (bukan ngitung scoringnya) sih menurutku -5 sampe +5 terlalu besar range nya. Reasoningnya:
Sebagai contoh, Amazon review menggunakan 5 stars (1 sampai 5) karena 5 secara natural cukup mudah dicerna: 1 sangat jelek, 2 jelek, 3 cukup, 4 baik, 5 sangat baik. Begitu pula Yelp review, Google review 5 stars dengan alasan yang sama. Dan juga kalau survey-survey atau tes psikotes rata-rata menggunakan range 5 karena memang bisa cepat dimengerti dengan sekilas lihat. Intuitif.

Nah di kita yang utama ada 3 poin kan sebenarnya: negatif, netral, dan positif. Dengan mengacu ke alesan di atas yang 5 range, menurutku cukup dari -3 sampai -3 (7 range) atau bahkan -2 sampai +2 (5 range): -2 sangat negatif, -1 negatif, 0 netral, +1 positif, +2 sangat positif. Simple.

Nah untuk metode skoring di belakangnya bentar ya baca-baca paper dulu siapa tahu ada yang menarik, besok deh :D Jadi skoring yang kita dapet melalui metode apapun nanti di scale/normalize ke yang 5 range itu.

Gimana?

@girikuncoro
Copy link
Contributor

Ini ada yang menarik juga: http://stackoverflow.com/questions/33543446/what-is-the-formula-of-sentiment-calculation

Papernya: Scaling Policy Preferences from Coded Political Texts http://www.kenbenoit.net/pdfs/Loweetal_2010_LSQ.pdf

@pyk
Copy link
Owner Author

pyk commented Oct 27, 2016

@girikuncoro yup bener mas, mungkin contoh skala -5 ke 5 terlalu besar haha

Jadi skoring yang kita dapet melalui metode apapun nanti di scale/normalize ke yang 5 range itu

Setuju 🙇

@pyk
Copy link
Owner Author

pyk commented Nov 6, 2016

Update: Untuk sekarang ini kita ada score confident_score_raw dan confident_score_scaled. Intinya untuk Rojak seberapa yakin dia kalau berita tersebut memiliki sentiment yg di prediksi.

Untuk score seberapa positif dan negatif kita belum ada

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants