오늘은 영화 DB 중에서도 비선호랑 선호 영화 & 장르를 어떻게 처리할지에 대해서 오래 대화를 나눴어요. 전처리를 하던 중에 가중치를 주면 선호 장르만! 나오는 걸 방지할 수 있다고 하더라고요. 그리고 아예! 전체 영화 DB에서 비선호 장르를 뺀 상태에서 영화 15개~20개를 추천해 주자는 내용으로 흘러갔어요.
마지막으로 채팅을 어떻게 구현할지에 대해서도 논의 중이었고, 청킹도 단위를 어떻게 해야 할지도 피드백 요청하기로 했어요.
피드백
<피드백> 1. 청킹 : 행 단위로 할 생각이었어요. → 행 단위나 글자 단위나 크게 중요한 건 아니지만, 전달할 때에 따라 달라짐 오버랩 사이즈도 그에 따라 달라짐. → 어떻게 전달할지에 따라서 사이즈 조정이 필요해요. → 행 단위가 낫다고 생각해요.
<오리지널 제목, 줄거리, 장르, 인기도> → 행 단위로 청킹 하는 게 결과가 잘 나와요. → 한 줄 안에 정리가 된다는 전제하에 청킹을 행 단위로 하는 게 낫다고 생각해요.
2. 비선호 제외 방법 1-1 : 벡터 검색할 때 비선호 장르를 제외한 장르를 넣고 검색하는데, 이때 선호 장르에 가중치를 준다. 방법 1-2 : 프롬프트에서 선호 영화를 바탕으로 유사한 영화 추천한다. 방법 2-1 : 선호 내용들을 바탕으로 영화 15개 ~ 20개 추천받는다. 방법 2-2 : 비선호 내용을 필터링하여 추천한다.
→ 방법 1이 훨씬 좋아 보여요. → 추천 쪽에서 중요한 게 탐색&활용의 균형을 맞추는 것이 중요. →탐색 : → 비선호 장르라도 조금씩 써보고 의외로 잘 맞으면 이것도 선호 장르에 반영시켜서 추천 퀄이 더 높아질 수 있음. → (== 맛있을 수도 있으니까 한 입 잡숴봐) →단점 : → 사용자가 비선호 보고 화날 수도. →활용 : → 기존 DB나 추천 시스템을 기반으로 최종적으로 방법 1이 우리의 프로젝트와 잘 맞을 것 같음.
3. 레디스 생각 중인데, 채팅을 구현하는 다른 효율적인 방법이 있는지 모르겠어요. 장고의 채널스 → 웹소캣 할 때도 쓸 수 있음 관리성을 봤을 땐 장고의 채널스가 맞다고 생각한다. → 장고 채널스를 권장함. 채널스만으로도 구현 가능한가요? → 이 정도 사이즈면 가능,, 하죠?
---------- <결론적으로 전하고 싶은 말은> → “옵션일 뿐, 여러분의 상황에 맞게끔 선택해 주세요” DRF에 이식하는 것도 준비를 슬슬해야 함 배포 생각 ㄴ 하지 마세요 LLM RAG(LangChain), DRF(account, Chatting), 협업
어느 정도로 겹쳐서 공유를 해야 할지, 분업해야 할지 모르겠어요 (협업 시, 업무 배당) → 문서로 리뷰를 공유하는 게 활용적, 서로 얻어가는 게 있으면 좋겠다. (최종을 위해)
<피드백> 1. 회원 DB, 영화 DB는 SQLite3을 쓰라고 하셨어요 2. 그리고 벡터 DB는 FAISS를 추천해주셨어요 3. 또한 영화 DB가 되는 게 총 80만 개나 돼서 너무 많다고 줄이라 하셨고요 4. 팀 단위로 깃 연습 하라고 하셨고요 5. 꼭 완성 못 해도 되니까 얻어가는 게 있었으면 좋겠다고 말씀하셨어요 5.1. 이번 프로젝트에서 팀 협업(GitHub)과 LLM, RAG가 중요하니까 많이 얻어갔으면 좋겠다 하셨어요!
오늘은 SA을 여기까지 완성했어요!
추후 더 추가해야 할 것 같아요 오늘 SA 특강이 있어서 들었는데, 추가사항이 많아 보여요!
트러블슈팅을 얼른 추가해서 사용하고 싶어요 스스로와 팀원들의 성장을 볼 수 있는 거라니!! 너무 재밌을 거 같아요 🤩
내일(15일 토요일) 팀원분들과 같이 데이터 임베딩 해볼 예정이에요! 저는 DRF을 담당하게 되었어요 🤪 파이팅! 마감날이 26일 수요일이에요! 부지런히 해봅시다~!
어제 정했던 "만 개의 레시피" 데이터를 분석을 해보았어요 근데,, 저희는 타겟 고객이 "자취생, 1인 가구"였단 말이죠?
<만 개의 레시피 문제점> 1. 조리 과정이 대표적인 행위만 적혀있고 상세 과정은 없음 → 예) 계란국 : 끓이기. 2. 밥 뿐만 아니라 디저트, 술안주, 김치 담그기 등 불필요한 카테고리가 많음 3. 신뢰성이 없음 → 요리사가 써준 게 아니라 일반인들이 요리 난이도를 매김 4. 자취생"만" 타겟하여 만든 자료가 아님
이러한 문제들이 있어서 주제를 확 바꾸었어요 DB를 쉽게 찾을 수 있는 영화 쪽으로 방향을 틀었답니다.
그러고, 피드백 받으러 튜터님 방으로 찾아갔습니다.
저희는 괜찮은 아이디어인지를 확인받은 후, Okay 하시면 시작할 목적으로 피드백받았어요! 아이디어 괜찮다고 하시고, 이전보다 더 좋은 프로젝트가 될 것 같다고 해주셨어요 😆
오전 피드백을 받은 후 FlowChart를 재수정하였어요
근데,, 흐름만 보면 이해는 하긴 했지만, 여기서 쓰이는 용어나 기술은 하나도 모르겠더라고요 공부해야죠 어쩌겠어요 🤪
오후
오후까지 이어졌던 팀 회의였어요!
잦은 피드백을 받으며 서서히 간결화되고, 복잡한 기능들은 단순한 기능들을 뼈대로 삼아서 수정하였습니다! 아마 기획 단계의 최종 FlowChart가 되지 않을까 싶네요!