길벗·이지톡

도서 IT전문서/IT입문서 데이터베이스/데이터분석

현직 AI Specialist에게 배우는 RAG! 파이썬, 오픈AI, Neo4j로 실습하며 개념과 원리를 이해하고, 오픈AI와 딥시크 비교 분석까지!

VectorRAG와 GraphRAG의 차이와 구현 방법을 기본 예제로 간단히!

OpenAI와 DeepSeek의 개념과 성능 차이를 실습을 통해 직접 확인한다.

 

 

VectorRAG와 GraphRAG, 두 RAG는 서로 어떻게 다를까요? 또 각각 어떤 데이터와 시나리오에서 활용하면 좋을까요? 이 책에서는 둘의 개념 및 원리를 비교하며 쉽게 이해할 수 있게 설명합니다. 이론을 핵심 위주로 간단히 살펴보고, 랭체인을 이용해 기본적인 예제를 구현하는 방법도 알아봅니다. GraphRAG를 구현할 때는 Neo4j에 데이터를 생성하고 검색하는 여러 방법에 대해 알아볼 것입니다. VectorRAG를 구현할 때는 오픈AI 모델 뿐만 아니라 딥시크 모델도 함께 알아보고 사용해볼 것입니다. 두 모델이 어느 정도의 성능 차이를 보이는지, 딥시크 모델을 로컬에 내려받아 안전하게 실행하면서 직접 확인해볼 수 있습니다. 이 책을 통해 RAG 및 LLM의 기초를 배우고, 기본적인 구현 방법을 경험해 보세요.

 

목차

1장 VectorRAG & GraphRAG 개념 이해하기

1.1 RAG란 무엇인가?

___1.1.1 RAG란?

___1.1.2 RAG의 필요성

___1.1.3 RAG 핵심 원리

___1.1.4 RAG 구현 방법

1.2 VectorRAG란 무엇인가?

___1.2.1 벡터란?

___1.2.2 벡터 처리 과정

___1.2.3 벡터 저장소

___1.2.4 VectorRAG란?

___1.2.5 VectorRAG는 언제 사용하나요?

1.3 GraphRAG란 무엇인가?

___1.3.1 그래프란?

___1.3.2 GraphDB: Neo4j

___1.3.3 GraphRAG란?

___1.3.4 GraphRAG는 언제 사용하나요?

 

 

2장 OpenAI 개념과 원리 이해하기

2.1 OpenAI란?

2.2 OpenAI 모델

___2.2.1 GPT 시리즈

___2.2.2 ChatGPT

___2.2.3 DALL·E 시리즈

___2.2.4 Whisper

___2.2.5 Sora

___2.2.6 임베딩

2.3 ChatGPT의 원리

___2.3.1 트랜스포머란?

___2.3.2 트랜스포머가 등장한 이유

2.4 OpenAI 추론 모델: o3-mini

___2.4.1 추론을 해야 하는 질문

___2.4.2 정답이 확실한 질문

2.5 OpenAI 모델 사용 시 고려사항

 

 

3장 DeepSeek 개념과 원리 이해하기

3.1 DeepSeek란?

3.2 DeepSeek가 부각된 배경

3.3 DeepSeek-R1의 원리

3.4 DeepSeek 모델

3.5 DeepSeek 모델 사용 시 고려사항

 

 

4장 실습 환경 준비하기

4.1 아나콘다 설치 및 구성

___4.1.1 아나콘다 설치하기

___4.1.2 아나콘다 가상 환경 구성하기

4.2 API 키 준비하기

4.3 DeepSeek 모델 준비하기

4.4 Neo4j 설치 및 구성하기

___4.4.1 Neo4j 설치하기

___4.4.2 Neo4j 사용 방법 익히기

___4.4.3 Neo4j에서 Cypher 사용하기

 

 

5장 VectorRAG 실습: OpenAI API 사용

5.1 자동차 데이터 검색하기

5.2 웹 데이터 검색하기

5.3 PDF에서 다육이 데이터 검색하기

5.4 랭체인의 메모리 사용하기

5.5 여러 파일에서 데이터 가져와 검색하기

5.6 랭체인 & 라마인덱스 비교

5.7 VectorRAG에 부적합한 사례

 

 

6장 VectorRAG 실습: DeepSeek 모델 사용

6.1 자동차 데이터 검색하기

6.2 웹 데이터 검색하기

6.3 PDF에서 다육이 데이터 검색하기

6.4 랭체인의 메모리 사용하기

6.5 여러 파일에서 데이터 가져와 검색하기

 

 

7장 GraphRAG 실습

7.1 랭체인에서 그래프 사용하기

7.2 축구 데이터 검색하기

___7.2.1 축구 데이터 생성하기

___7.2.2 축구 데이터 검색하기

7.3 PDF 파일 불러와서 검색하기

7.4 영화 데이터 검색하기

___7.4.1 영화 데이터 생성하기

___7.4.2 영화 데이터 검색하기

7.5 자동차 데이터 검색하기

___7.5.1 자동차 데이터 생성하기

___7.5.2 자동차 데이터 검색하기

7.6 건강 데이터 검색하기

___7.6.1 건강 데이터 생성하기

___7.6.2 건강 데이터 검색하기

 

8장 Copilot과 GraphRAG 비교 및 RAG의 사회적 영향

8.1 Copilot에서 사용하는 그래프 기반 검색과 GraphRAG 비교

___8.1.1 Copilot에서 사용하는 검색

___8.1.2 일반적인 RAG와 Copilot 검색 비교

8.2 RAG 패러다임 이후: 다음 단계는?

___8.2.1 RAG의 한계와 발전 방향

___8.2.2 AI Agent와 강화학습

8.3 RAG의 사회적 영향

___8.3.1 신뢰성과 투명성 문제

___8.3.2 AI의 윤리적 고려 사항

___8.3.3 정책 및 규제 이슈

8.4 인간 삶의 변화

___8.4.1 업무의 변화

___8.4.2 개인 삶의 변화

 

 

찾아보기

 

더보기접기

저자&기여자

ㆍ지은이 서지영

소개
마이크로소프트에서 Data & AI Specialist로 근무 중이며, 정보관리기술사와 컴퓨터시스템응용기술사로 20년 넘게 IT 분야에서 일하고 있다. 고려대학교 대학원에서 빅데이터 및 인공지능에 대한 전문적인 연구를 진행하면서 『모두의 인공지능 기초 수학』(길벗, 2020), 『딥러닝 텐서플로 교과서』(길벗, 2021), 『딥러닝 파이토치 교과서』(길벗, 2022), 『챗GPT, 거부할 수 없는 미래』(길벗, 2023) 『랭체인으로 LLM 기반의 AI 서비스 개발하기』(길벗, 2024), 『랭체인 & 랭그래프로 AI 에이전트 개발하기』(길벗, 2025) 등을 저술했다.

보도자료

저작권 안내

모든 자료는 저작권법의 보호를 받는 저작물로, 허락 없이 편집하거나 다른 매체에 옮겨 실을 수 없습니다.
인공지능(AI) 기술 또는 시스템을 훈련하기 위해 자료의 전체 내용은 물론 일부도 사용하는 것을 금지합니다.

All materials are protected by copyright law and may not be edited or reproduced in other media without permission.
It is prohibited to use all or part of the materials, including for training artificial intelligence (AI) technologies or systems, without authorization.

연관 프로그램

아래 프로그램은 길벗출판사가 제공하는 것이 아닙니다.
무료로 사용할 수 있는 정보를 안내해 드리니, 지원이 필요하면 해당 프로그렘 제작사로 문의해 주세요.