Toronto Lobbying Search

Pulling lobbying activity data from Toronto Open Data (ETL) into a vector database (ChromaDB) and allowing users to search through it via a webapp (streamlit).

Semantic matching is matching search queries to keywords based upon the intent of what the searcher typed into the engine, instead of just using keywords.

Source of the data: https://open.toronto.ca/dataset/lobbyist-registry/

TO DO:

UI
dockerize pipeline

Running ChromaDB

You can run ChromaDB within a docker container by pulling the official image and running it.

docker pull chromadb/chroma
docker run -p 8000:8000 chromadb/chroma

Cost Estimation

Done using: https://github.com/openai/tiktoken

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
.streamlit		.streamlit
data		data
.env.example		.env.example
.gitignore		.gitignore
README.MD		README.MD
app.py		app.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Toronto Lobbying Search

Pulling lobbying activity data from Toronto Open Data (ETL) into a vector database (ChromaDB) and allowing users to search through it via a webapp (streamlit).

Running ChromaDB

Cost Estimation

About

Releases

Packages

Languages

thomaslillo/toronto-lobbying-activity-search

Folders and files

Latest commit

History

Repository files navigation

Toronto Lobbying Search

Pulling lobbying activity data from Toronto Open Data (ETL) into a vector database (ChromaDB) and allowing users to search through it via a webapp (streamlit).

Running ChromaDB

Cost Estimation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages