Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Un notebook pour automatiser le lancement de tests en fonction de différents paramètress #32

Open
wants to merge 4 commits into
base: main
Choose a base branch
from

Conversation

rprebot
Copy link
Contributor

@rprebot rprebot commented Dec 9, 2024

  • Le notebook importe les fonctions dans "framework_test_functions.py" et les instructions contenues dans 'instructions_LLM.py' (qui historise les versions de prompt)

  • 3 paramètres de test sont possible sur ce notebook : le "top_K" de chunks récupérées en sortie de chaque queries, le choix du prompt (mistral/albert/chatgpt), et la version des instructions.

Pour la suite, il faut :

  • rajouter des paramètres de tests. En priorité, la possibilité d'ingérer le texte complet VS seulement le chunk aujourd'hui dans le prompt.
  • obtenir des scores de performance en approximant la précision / le recall, en comparant aux réponses types attendues dans la base de 20 questions annotées

…et obtenir la réponse.

3 paramètres existent pour l'instant : le "top_K" de chunks récupérées en sortie de chaque queries, le choix du prompt (mistral/albert/chatgpt), et la version des instructions.

Pour cela le notebook importe 'instructions_LLM' (qui historise les versions de prompt) et framework_test_functions

Pour la suite, il faut : 
- rajouter des paramètres de tests. En priorité, la possibilité d'ingérer le texte complet à la place du chunk dans le prompt. 
- obtenir des scores de performance approximant la précision / le recall sur la base de 20 questions annotées
@rprebot rprebot requested review from RealVidy and maxgfr December 9, 2024 18:32
@rprebot rprebot self-assigned this Dec 9, 2024
@RealVidy RealVidy force-pushed the framework_pipeline_test branch 2 times, most recently from 9ab8be5 to 0bdc485 Compare December 9, 2024 19:56
@RealVidy
Copy link
Contributor

Penchons-nous là dessus demain Rémi.
Je vais te montrer comment utiliser des notebooks en local de façon à ce que tu puisses travailler dans le repo directement plutôt que sur Google Colab. Ça rendra d'autant plus facile la création de scripts à partir de ton notebook.

Avec la méthode actuelle c'est difficile de review le code (en général on ne review pas des notebooks si on peut l'éviter) et surtout difficile d'intégrer le travail qu'a déjà fait Maxime.

@RealVidy
Copy link
Contributor

Cela dit les résultats ont l'air cools !

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants