✨ MRC training modules : post-train & fine-tune ✨
mrc-search-engine은 검색 엔진과 함께 사용되는 기계독해(Machine Reading Comprehension) 모듈을 개발하는 프로젝트입니다.
sudo wget -qO- http://get.docker.com/ | sh
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
&& curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - \
&& curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update
sudo apt-get install -y nvidia-docker2
sudo systemctl restart docker
docker load -i mrc.tar
docker run -it --gpus all -p 8000:8000 mrc
JDK 설치 (1.7 버전 이후) 및 JAVA_HOME 환경 변수 설정
apt-get install openjdk-17-jdk
Mecab 설치
wget https://bitbucket.org/eunjeon/mecab-ko/downloads/mecab-0.996-ko-0.9.2.tar.gz && \
tar xvfz mecab-0.996-ko-0.9.2.tar.gz && \
cd mecab-0.996-ko-0.9.2 && \
./configure && \
make && \
make check && \
make install && \
ldconfig
Mecab-dictionary 설치
wget https://bitbucket.org/eunjeon/mecab-ko-dic/downloads/mecab-ko-dic-2.1.1-20180720.tar.gz && \
tar xvfz mecab-ko-dic-2.1.1-20180720.tar.gz && \
cd mecab-ko-dic-2.1.1-20180720 && \
./configure && \
make && \
make install
파이썬 라이브러리 설치
pip install -r modules/mrc_service/requirements.txt
가상 환경 설정(Conda)
conda create --name (이름) python=3.8
가상 환경 활성화/비활성화(Conda)
conda activate (이름)
conda deactivate
패키지 설치(CPU)
pip install -r requirements.txt
패키지 설치(GPU)
pip install -r requirements_gpu.txt
requirements.txt 생성
pip list --format=freeze > requirements.txt
cd modules
python.exe -m main.py post-training
훈련 과정상의 변경점을 주고 싶다면 다양한 인자를 추가할 수 있습니다. 다음 명령어를 통해서 이를 확인해 보세요.
python.exe -m main.py --help
해당 프로젝트는 훈련한 모델을 사용할 수 있는 api server를 동시에 제공합니다. Service program 관련 사항은 서비스 모듈를 참조합니다.