논의 내용

오늘은 영화 DB 중에서도 비선호랑 선호 영화 & 장르를 어떻게 처리할지에 대해서 오래 대화를 나눴어요.
전처리를 하던 중에 가중치를 주면 선호 장르만! 나오는 걸 방지할 수 있다고 하더라고요.
그리고
아예! 전체 영화 DB에서 비선호 장르를 뺀 상태에서 영화 15개~20개를 추천해 주자는 내용으로 흘러갔어요.

마지막으로 채팅을 어떻게 구현할지에 대해서도 논의 중이었고, 청킹도 단위를 어떻게 해야 할지도 피드백 요청하기로 했어요.

피드백

<피드백>
1. 청킹 : 행 단위로 할 생각이었어요.
→ 행 단위나 글자 단위나 크게 중요한 건 아니지만, 전달할 때에 따라 달라짐 오버랩 사이즈도 그에 따라 달라짐.
→ 어떻게 전달할지에 따라서 사이즈 조정이 필요해요.
→ 행 단위가 낫다고 생각해요.

<오리지널 제목, 줄거리, 장르, 인기도>
→ 행 단위로 청킹 하는 게 결과가 잘 나와요.
→ 한 줄 안에 정리가 된다는 전제하에 청킹을 행 단위로 하는 게 낫다고 생각해요.

2. 비선호 제외
방법 1-1 : 벡터 검색할 때 비선호 장르를 제외한 장르를 넣고 검색하는데, 이때 선호 장르에 가중치를 준다.
방법 1-2 : 프롬프트에서 선호 영화를 바탕으로 유사한 영화 추천한다.
방법 2-1 : 선호 내용들을 바탕으로 영화 15개 ~ 20개 추천받는다.
방법 2-2 : 비선호 내용을 필터링하여 추천한다.

→ 방법 1이 훨씬 좋아 보여요.
→ 추천 쪽에서 중요한 게 탐색&활용의 균형을 맞추는 것이 중요.
 탐색 :
→ 비선호 장르라도 조금씩 써보고 의외로 잘 맞으면 이것도 선호 장르에 반영시켜서 추천 퀄이 더 높아질 수 있음.
→ (== 맛있을 수도 있으니까 한 입 잡숴봐)
 단점 :
→ 사용자가 비선호 보고 화날 수도.
 활용 :
→ 기존 DB나 추천 시스템을 기반으로 최종적으로 방법 1이 우리의 프로젝트와 잘 맞을 것 같음.

3. 레디스 생각 중인데, 채팅을 구현하는 다른 효율적인 방법이 있는지 모르겠어요.
장고의 채널스 → 웹소캣 할 때도 쓸 수 있음
관리성을 봤을 땐 장고의 채널스가 맞다고 생각한다. → 장고 채널스를 권장함.
채널스만으로도 구현 가능한가요? → 이 정도 사이즈면 가능,, 하죠?

----------
<결론적으로 전하고 싶은 말은> → “옵션일 뿐, 여러분의 상황에 맞게끔 선택해 주세요”
DRF에 이식하는 것도 준비를 슬슬해야 함
배포 생각 ㄴ 하지 마세요
LLM RAG(LangChain), DRF(account, Chatting), 협업

어느 정도로 겹쳐서 공유를 해야 할지, 분업해야 할지 모르겠어요 (협업 시, 업무 배당)
→ 문서로 리뷰를 공유하는 게 활용적, 서로 얻어가는 게 있으면 좋겠다. (최종을 위해)

 

다행히 프로젝트 면에서 더 추가해야 하는 기술은 없었어요!

채널스랑 JS, LLM RAG 공부를 진행하면 돼요!

 

점점 알아가는 기술과 내용이 많아지는 느낌이 들어서 행복합니다 😋

내일 19(수) 10시까지 LangChain 공부해 오기로 했어요!

파이팅입니다!

+ Recent posts