Wfh/add semistructured (#38)

Refactoring to share rag things --------- Co-authored-by: Eugene Yurtsev <[email protected]>
langchain-ai · Nov 21, 2023 · 8e58d6d · 8e58d6d
1 parent 52241e9
commit 8e58d6d
Show file tree

Hide file tree

Showing 45 changed files with 1,979 additions and 2,188 deletions.
diff --git a/csv-qa/pandas_agent_instruct.py b/csv-qa/pandas_agent_instruct.py
@@ -5,7 +5,6 @@
 )
 from langchain.embeddings import OpenAIEmbeddings
 from langchain.llms import OpenAI
-from langchain.prompts import PromptTemplate
 from langchain.smith import RunEvalConfig, run_on_dataset
 from langchain.tools import PythonAstREPLTool
 from langchain.vectorstores import FAISS

diff --git a/csv-qa/pandas_ai.py b/csv-qa/pandas_ai.py
@@ -1,6 +1,4 @@
 import pandas as pd
-from langchain.agents.agent_toolkits import create_pandas_dataframe_agent
-from langchain.agents.agent_types import AgentType
 from langchain.chat_models import ChatOpenAI
 from langchain.prompts import ChatPromptTemplate
 from langchain.schema.output_parser import StrOutputParser

diff --git a/docs/source/notebooks/rag.ipynb b/docs/source/notebooks/rag.ipynb
diff --git a/docs/source/notebooks/rag_langchain_docs.ipynb b/docs/source/notebooks/rag_langchain_docs.ipynb
diff --git a/docs/source/notebooks/rag_semi_structured.ipynb b/docs/source/notebooks/rag_semi_structured.ipynb
diff --git a/langchain-docs-benchmarking/packages/openai-functions-agent/openai_functions_agent/agent.py b/langchain-docs-benchmarking/packages/openai-functions-agent/openai_functions_agent/agent.py
@@ -82,4 +82,4 @@ def mapper(input: dict):
 
 agent_executor = (mapper | agent_executor | (lambda x: x["output"])).with_types(
     input_type=ChainInput
-)
+)
diff --git a/langchain-docs-benchmarking/prepare_dataset.py b/langchain-docs-benchmarking/prepare_dataset.py
@@ -1,7 +1,7 @@
 """Copy the public dataset to your own langsmith tenant."""
 from typing import Optional
+
 from langsmith import Client
-from tqdm import tqdm
 
 DATASET_NAME = "LangChain Docs Q&A"
 PUBLIC_DATASET_TOKEN = "452ccafc-18e1-4314-885b-edd735f17b9d"

diff --git a/langchain_benchmarks/extraction/email_task.py b/langchain_benchmarks/extraction/email_task.py
@@ -1,5 +1,5 @@
 from enum import Enum
-from typing import Optional, List
+from typing import List, Optional
 
 from langchain.smith import RunEvalConfig
 from pydantic import BaseModel, Field

diff --git a/langchain_benchmarks/rag/.gitignore b/langchain_benchmarks/rag/.gitignore
@@ -0,0 +1 @@
+*.sql
diff --git a/langchain_benchmarks/rag/__init__.py b/langchain_benchmarks/rag/__init__.py
@@ -1,8 +1,5 @@
-"""RAG environments."""
-from langchain_benchmarks.rag.evaluators import RAG_EVALUATION
-from langchain_benchmarks.rag.environments.langchain_docs.task import (
-    LANGCHAIN_DOCS_TASK,
-)
+from langchain_benchmarks.rag.evaluators import get_eval_config
+from langchain_benchmarks.rag.tasks import LANGCHAIN_DOCS_TASK
 
-# Please keep this list sorted!
-__all__ = ["LANGCHAIN_DOCS_TASK", "RAG_EVALUATION"]
+# Please keep this sorted
+__all__ = ["get_eval_config", "LANGCHAIN_DOCS_TASK"]
diff --git a/langchain_benchmarks/rag/environments/langchain_docs/architectures/__init__.py b/langchain_benchmarks/rag/environments/langchain_docs/architectures/__init__.py
diff --git a/langchain_benchmarks/rag/environments/langchain_docs/langchain_docs_retriever/__init__.py b/langchain_benchmarks/rag/environments/langchain_docs/langchain_docs_retriever/__init__.py
diff --git a/..._benchmarks/rag/environments/langchain_docs/langchain_docs_retriever/db_docs/docs.parquet b/..._benchmarks/rag/environments/langchain_docs/langchain_docs_retriever/db_docs/docs.parquet
diff --git a/langchain_benchmarks/rag/environments/langchain_docs/langchain_docs_retriever/download_db.py b/langchain_benchmarks/rag/environments/langchain_docs/langchain_docs_retriever/download_db.py
diff --git a/langchain_benchmarks/rag/environments/langchain_docs/langchain_docs_retriever/retriever.py b/langchain_benchmarks/rag/environments/langchain_docs/langchain_docs_retriever/retriever.py
diff --git a/langchain_benchmarks/rag/evaluators.py b/langchain_benchmarks/rag/evaluators.py
@@ -77,18 +77,21 @@ def evaluate_run(
 """  # noqa
 }
 
-eval_llm = ChatOpenAI(model="gpt-4", temperature=0.0, model_kwargs={"seed": 42})
-# Use a longer-context LLM to check documents
-faithfulness_eval_llm = ChatOpenAI(
-    model="gpt-4-1106-preview", temperature=0.0, model_kwargs={"seed": 42}
-)
 
-RAG_EVALUATION = RunEvalConfig(
-    evaluators=[
-        RunEvalConfig.LabeledScoreString(
-            criteria=_ACCURACY_CRITERION, llm=eval_llm, normalize_by=10.0
-        ),
-        RunEvalConfig.EmbeddingDistance(),
-    ],
-    custom_evaluators=[FaithfulnessEvaluator(llm=faithfulness_eval_llm)],
-)
+def get_eval_config() -> RunEvalConfig:
+    """Returns the evaluator for the environment."""
+    eval_llm = ChatOpenAI(model="gpt-4", temperature=0.0, model_kwargs={"seed": 42})
+    # Use a longer-context LLM to check documents
+    faithfulness_eval_llm = ChatOpenAI(
+        model="gpt-4-1106-preview", temperature=0.0, model_kwargs={"seed": 42}
+    )
+
+    return RunEvalConfig(
+        evaluators=[
+            RunEvalConfig.LabeledScoreString(
+                criteria=_ACCURACY_CRITERION, llm=eval_llm, normalize_by=10.0
+            ),
+            RunEvalConfig.EmbeddingDistance(),
+        ],
+        custom_evaluators=[FaithfulnessEvaluator(llm=faithfulness_eval_llm)],
+    )
diff --git a/langchain_benchmarks/rag/tasks/__init__.py b/langchain_benchmarks/rag/tasks/__init__.py
@@ -0,0 +1,7 @@
+from langchain_benchmarks.rag.tasks.langchain_docs.task import LANGCHAIN_DOCS_TASK
+from langchain_benchmarks.rag.tasks.semi_structured_earnings.task import (
+    SEMI_STRUCTURED_EARNINGS_TASK,
+)
+
+# Please keep this sorted
+__all__ = ["LANGCHAIN_DOCS_TASK", "SEMI_STRUCTURED_EARNINGS_TASK"]
diff --git a/...rag/environments/langchain_docs/README.md → ...hmarks/rag/tasks/langchain_docs/README.md b/...rag/environments/langchain_docs/README.md → ...hmarks/rag/tasks/langchain_docs/README.md
@@ -1,6 +1,10 @@
-# LangChain Docs Environment
+# LangChain Docs Task 
 
 This code contains utilities to scrape the LangChain docs (already run) and index them
 using common techniques. The docs were scraped using the code in `_ingest_docs.py` and
 uploaded to gcs. To better compare retrieval techniques, we hold these constant and pull
 from that cache whenever generating different indices.
+
+
+The content in `indexing` composes some common indexing strategies with default paramaters for
+benchmarking on the langchain docs.
diff --git a/langchain_benchmarks/rag/tasks/langchain_docs/__init__.py b/langchain_benchmarks/rag/tasks/langchain_docs/__init__.py
@@ -0,0 +1,8 @@
+from langchain_benchmarks.rag.tasks.langchain_docs import architectures, indexing
+from langchain_benchmarks.rag.tasks.langchain_docs.task import LANGCHAIN_DOCS_TASK
+
+DATASET_ID = (
+    "452ccafc-18e1-4314-885b-edd735f17b9d"  # ID of public LangChain Docs dataset
+)
+
+__all__ = ["architectures", "indexing", "DATASET_ID", "LANGCHAIN_DOCS_TASK"]
-Original file line number
+Diff line change
@@ Expand Up / @@ -82,4 +82,4 @@ def mapper(input: dict): @@
     agent_executor = (mapper | agent_executor | (lambda x: x["output"])).with_types(
         input_type=ChainInput
-    )
+    )