llamacpp - Monologue

Monologue

llamacpp

A collection of 2 posts

뉴스 기사 수집해서 llama2 에 질의하기 (feat. Silicon 맥북 with GPU)

뉴스 기사 수집해서 llama2 에 질의하기 (feat. Silicon 맥북 with GPU)

M1/M2 같은 Silicon Mac 계열에서 GPU 를 사용하여 llama2 를 파인튜닝 해보고, 뉴스기사를 Embedding 하여 langchain 으로 얼마나 만족스러운 답변을 하는지를 테스트 해봤다.

Embedding으로 Llama2 응답 보정하기 (feat. langchain)

Embedding으로 Llama2 응답 보정하기 (feat. langchain)

로컬머신에서 LlamaCpp 로 Llama2를 구동하고 Llama2 가 부족한 정보를 벡터디비로 보완해서 성능을 최적화 하는 과정을 정리해본다.