Tinkerbell Glitter
[250311] AutoRAG (Automatic Retrieval-Augmented Generation)๋ž€?
AI ๐Ÿค–/DL ๐Ÿง 
AutoRAG (Automatic Retrieval-Augmented Generation)๋ž€?1. AutoRAG ์ •์˜AutoRAG (Automatic Retrieval-Augmented Generation)์€ Retrieval-Augmented Generation(RAG)์˜ ํ”„๋กœ์„ธ์Šค๋ฅผ ์ž๋™ํ™”ํ•˜๋Š” ๊ธฐ๋ฒ•์ด๋‹ค. RAG๋Š” ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰(Retrieval)ํ•˜๊ณ  ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ํ…์ŠคํŠธ๋ฅผ ์ƒ์„ฑ(Generation)ํ•˜๋Š” AI ๋ชจ๋ธ์„ ์˜๋ฏธํ•˜๋ฉฐ, AutoRAG๋Š” ์ด ๊ณผ์ •์„ ์ž๋™์œผ๋กœ ์ตœ์ ํ™”ํ•˜์—ฌ ํšจ์œจ์ ์ธ ์ •๋ณด ๊ฒ€์ƒ‰ ๋ฐ ์‘๋‹ต ์ƒ์„ฑ์„ ๋ชฉํ‘œ๋กœ ํ•œ๋‹ค.2. AutoRAG์˜ ํ•ต์‹ฌ ๊ฐœ๋…์ž๋™ ๊ฒ€์ƒ‰ ์ตœ์ ํ™” (Auto-Retrieval Optimization)์‚ฌ์šฉ์ž์˜ ์งˆ์˜(Query)์— ๋งž์ถฐ ์ตœ์ ์˜ ๊ฒ€์ƒ‰ ์ „๋žต์„ ์ž๋™์œผ๋กœ ์กฐ์ •๋ฌธ์„œ ์ž„๋ฒ ๋”ฉ(Embed..
[250307] FAISS vs ChromaDB ์ฐจ์ด์ 
AI ๐Ÿค–/DL ๐Ÿง 
๐Ÿ” FAISS vs ChromaDB: ๊ธฐ๋Šฅ์  ์ฐจ์ด์ 1. FAISS (Facebook AI Similarity Search) ์ •๋ฆฌ์ฃผ์š” ๊ธฐ๋Šฅ: ๋Œ€๊ทœ๋ชจ ๋ฒกํ„ฐ ๊ฒ€์ƒ‰์„ ๋น ๋ฅด๊ฒŒ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์‚ฌ์šฉ ๋ชฉ์ : ์ฃผ๋กœ ๋ฒกํ„ฐ ๊ฒ€์ƒ‰์„ ์ตœ์ ํ™”ํ•˜๊ธฐ ์œ„ํ•œ ์ธ๋ฑ์‹ฑ ๋ฐ ๊ฒ€์ƒ‰ ์—”์ง„ ์—ญํ• ํ•ต์‹ฌ ๊ธฐ๋Šฅ:๋ฒกํ„ฐ ์ธ๋ฑ์Šค ์ƒ์„ฑ (`IndexFlatL2`, `IVFFlat`, `HNSW` ๋“ฑ)์œ ์‚ฌ๋„ ๊ฒ€์ƒ‰ (L2 ๊ฑฐ๋ฆฌ, ๋‚ด์ , ์ฝ”์‚ฌ์ธ ์œ ์‚ฌ๋„ ๋“ฑ)GPU ๊ฐ€์† ์ง€์› (CUDA ํ™œ์šฉ ๊ฐ€๋Šฅ)๋ฒกํ„ฐ ์ €์žฅ ๊ธฐ๋Šฅ: ์ œ๊ณตํ•˜์ง€ ์•Š์Œ (๋””์Šคํฌ์— ์ €์žฅํ•˜๋Š” ๊ธฐ๋Šฅ์€ ์žˆ์ง€๋งŒ, DB์ฒ˜๋Ÿผ ๊ด€๋ฆฌ๋˜๋Š” ๊ฒƒ์€ ์•„๋‹˜)2. ChromaDB ์ •๋ฆฌ์ฃผ์š” ๊ธฐ๋Šฅ: ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅํ•˜๊ณ  ๊ด€๋ฆฌํ•˜๋Š” ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค(Vector DB)์‚ฌ์šฉ ๋ชฉ์ : ๋ฒกํ„ฐ ์ž„๋ฒ ๋”ฉ์„ ์ €์žฅํ•˜๊ณ , ์ง€์†์ ์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ CRUD(C..
[250304] RAG ์ •๋ฆฌ
AI ๐Ÿค–/DL ๐Ÿง 
RAG (Retrieval-Augmented Generation)๋ž€?1. RAG ์ •์˜RAG(Retrieval-Augmented Generation)๋Š” ์ •๋ณด ๊ฒ€์ƒ‰(Retrieval)๊ณผ ์ƒ์„ฑ ๋ชจ๋ธ(Generation)์„ ๊ฒฐํ•ฉํ•˜์—ฌ ๋” ์ •ํ™•ํ•˜๊ณ  ์ตœ์‹  ์ •๋ณด๋ฅผ์ œ๊ณตํ•˜๋Š” AI ๊ธฐ์ˆ ์ด๋‹ค. ๋‹จ์ˆœํžˆ ์‚ฌ์ „ ํ•™์Šต๋œ ์–ธ์–ด ๋ชจ๋ธ์ด ์•„๋‹Œ, ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋‚˜ ๋ฌธ์„œ์—์„œ ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ํ•œ ํ›„ ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์‘๋‹ต์„์ƒ์„ฑํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค.ํ•ต์‹ฌ ๊ฐœ๋…Retrieval (๊ฒ€์ƒ‰)์ฃผ์–ด์ง„ ์งˆ์˜(Query)์™€ ๊ด€๋ จ๋œ ๋ฌธ์„œ๋ฅผ ๋ฒกํ„ฐ ๊ฒ€์ƒ‰(Vector Search) ๋˜๋Š” ํ‚ค์›Œ๋“œ ๊ฒ€์ƒ‰์„ ํ†ตํ•ด ์ฐพ์•„๋‚ธ๋‹ค.์ผ๋ฐ˜์ ์œผ๋กœ FAISS, ChromaDB, Weaviate, Elasticsearch ๊ฐ™์€ ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋ฅผ ํ™œ์šฉํ•œ๋‹ค.๋ฌธ์„œ ์ž„๋ฒ ๋”ฉ(Document Embedding)์„ ..
[250226] ์ž„๋ฒ ๋”ฉ(Embedding)์ด๋ž€
AI ๐Ÿค–/DL ๐Ÿง 
์ž„๋ฒ ๋”ฉ(Embedding)์ด๋ž€?1. ์ž„๋ฒ ๋”ฉ(Embedding) ์ •์˜์ž„๋ฒ ๋”ฉ(Embedding)์€ ๋ฐ์ดํ„ฐ๋ฅผ ๊ณ ์ •๋œ ํฌ๊ธฐ์˜ ๋ฒกํ„ฐ ๊ณต๊ฐ„(Vector Space) ์œผ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.ํŠนํžˆ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ(NLP) ๋ฐ ์ถ”์ฒœ ์‹œ์Šคํ…œ, ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ ๋“ฑ์—์„œ ์ž์ฃผ ์‚ฌ์šฉ๋œ๋‹ค. ์ฃผ๋กœ ๊ณ ์ฐจ์› ๋ฐ์ดํ„ฐ๋ฅผ ์ €์ฐจ์› ์—ฐ์† ๊ณต๊ฐ„์œผ๋กœ ๋งคํ•‘ํ•˜๋Š” ๊ณผ์ •์„ ์˜๋ฏธํ•œ๋‹ค.๐Ÿ”น ํ•ต์‹ฌ ๊ฐœ๋…๊ณ ์ฐจ์› → ์ €์ฐจ์› ๋ณ€ํ™˜: ๋‹จ์–ด, ๋ฌธ์žฅ, ์ด๋ฏธ์ง€ ๋“ฑ์„ ์ˆ˜์น˜ ๋ฒกํ„ฐ(embedding vector) ๋กœ ๋ณ€ํ™˜์œ ์‚ฌ์„ฑ ๋ณด์กด: ์˜๋ฏธ์ ์œผ๋กœ ๋น„์Šทํ•œ ๋ฐ์ดํ„ฐ๋Š” ๋ฒกํ„ฐ ๊ณต๊ฐ„์—์„œ๋„ ๊ฐ€๊น๊ฒŒ ์œ„์น˜ํ•™์Šต ๊ธฐ๋ฐ˜ ๋ณ€ํ™˜: ๋‹จ์ˆœ ๋งคํ•‘์ด ์•„๋‹ˆ๋ผ ํ•™์Šต์„ ํ†ตํ•ด ์˜๋ฏธ ์žˆ๋Š” ๋ณ€ํ™˜์„ ์ˆ˜ํ–‰2. ์ž„๋ฒ ๋”ฉ์˜ ํ™œ์šฉ ์‚ฌ๋ก€1) ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ(NLP)ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜ํ•˜์—ฌ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์ด ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•œ๋‹ค.๋Œ€ํ‘œ์ ์ธ ๋ฐฉ..
[250214] Parser ์ •๋ฆฌ
AI ๐Ÿค–/DL ๐Ÿง 
Parser(ํŒŒ์„œ)๋ž€?1. Parser(ํŒŒ์„œ) ์ •์˜ํŒŒ์„œ(Parser)๋Š” ๋ฌธ์ž์—ด ๋ฐ์ดํ„ฐ(์ฝ”๋“œ, ๋ฌธ์„œ, JSON ๋“ฑ)๋ฅผ ํ•ด์„ํ•˜๊ณ  ๊ตฌ์กฐํ™”ํ•˜๋Š” ์—ญํ• ์„ ํ•˜๋Š” ํ”„๋กœ๊ทธ๋žจ ๋˜๋Š” ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ด๋‹ค.์ฃผ์–ด์ง„ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฌธ๋ฒ•์— ๋งž๊ฒŒ ๋ถ„์„ํ•˜์—ฌ ์˜๋ฏธ ์žˆ๋Š” ๊ตฌ์กฐ(ํŠธ๋ฆฌ, ๊ฐ์ฒด ๋“ฑ)๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ฒƒ์ด ํ•ต์‹ฌ ์—ญํ• ์ด๋‹ค.2. ํŒŒ์„œ์˜ ํ•„์š”์„ฑ๋ฐ์ดํ„ฐ ๋ณ€ํ™˜ – ์ž…๋ ฅ๋œ ๋ฐ์ดํ„ฐ๋ฅผ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด๊ฐ€ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋„๋ก ๋ณ€ํ™˜๋ฌธ๋ฒ• ๊ฒ€์ฆ – ์ฝ”๋“œ๋‚˜ ๋ฐ์ดํ„ฐ๊ฐ€ ๋ฌธ๋ฒ•์ ์œผ๋กœ ์˜ฌ๋ฐ”๋ฅธ์ง€ ๊ฒ€์‚ฌ๊ตฌ์กฐํ™”๋œ ์ •๋ณด ์ œ๊ณต – ์›์‹œ ๋ฐ์ดํ„ฐ๋ฅผ ํŠธ๋ฆฌ, ๊ฐ์ฒด ๋“ฑ์œผ๋กœ ๋ณ€ํ™˜ํ•˜์—ฌ ์‰ฝ๊ฒŒ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•จ3. ํŒŒ์„œ์˜ ์ฃผ์š” ์œ ํ˜•ํŒŒ์„œ๋Š” ํฌ๊ฒŒ ๊ตฌ๋ฌธ ๋ถ„์„ ๋Œ€์ƒ๊ณผ ๋ถ„์„ ๋ฐฉ์‹์— ๋”ฐ๋ผ ๋ถ„๋ฅ˜ํ•  ์ˆ˜ ์žˆ๋‹ค.1๏ธโƒฃ ๋ฐ์ดํ„ฐ ํฌ๋งท ๊ธฐ๋ฐ˜์œ ํ˜•์„ค๋ช…์˜ˆ์ œJSON ํŒŒ์„œJSON ๋ฐ์ดํ„ฐ๋ฅผ ํŒŒ์ด์ฌ ๊ฐ์ฒด๋กœ ๋ณ€ํ™˜`json.loads()`..
[250212] LangChain์ด ๋ญ”๋ฐ~
AI ๐Ÿค–/DL ๐Ÿง 
LangChain์ด๋ž€? โ›“๏ธ1. LangChain ์ •์˜LangChain์€ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM, Large Language Model)์˜ ํ™œ์šฉ์„ ์‰ฝ๊ฒŒ ๋งŒ๋“ค์–ด์ฃผ๋Š” ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, OpenAI GPT, Hugging Face์˜ Transformers, Cohere ๋“ฑ์˜ ๋‹ค์–‘ํ•œ LLM์„ ์—ฐ๊ฒฐํ•˜์—ฌ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๊ตฌ์ถ•ํ•  ์ˆ˜ ์žˆ๋„๋ก ๋„์™€์ค€๋‹ค. ํŠนํžˆ, ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง, ์ฒด์ด๋‹(Chaining), ๋ฉ”๋ชจ๋ฆฌ ๊ด€๋ฆฌ, ๋ฐ์ดํ„ฐ ๊ฒ€์ƒ‰(Augmented Generation) ๋“ฑ์„ ํฌํ•จํ•œ ๋‹ค์–‘ํ•œ ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•œ๋‹ค.2. LangChain์˜ ์ฃผ์š” ๊ฐœ๋…1) LLMs (Large Language Models)LangChain์€ ๋‹ค์–‘ํ•œ LLM์„ ์ง€์›ํ•˜๋ฉฐ, ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ(NLP) ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๊ฐœ๋ฐœํ•  ์ˆ˜ ์žˆ๋‹ค.from langc..