데이터브릭스 생성형 AI 엔지니어 자격증 기출 문제 덤프 5/6 (45문제)

Databricks Certified Generative AI Engineer 자격증 취득을 위한 덤프 5번째 시리즈입니다. 실전 시험의 난이도를 반영한 기출 유형들로 학습 효율을 극대화하세요.

반복적인 문제 풀이는 자격증 합격을 위한 가장 확실한 방법입니다. 페이지 내 정답 기능을 활용해 막힘없이 학습을 이어가시길 바랍니다.

참고해 주세요! 기출 덤프의 특성상 일부 문제나 선지, 정답에 오류가 있을 수 있습니다. 학습 시 이상한 점이 있다면 교재나 공식 문서를 통해 정답을 다시 한번 확인해 보시는 것을 추천합니다.”

데이터브릭스 생성형 AI 엔지니어 자격증 기출 문제 덤프 5/6 (45문제)

Question 1

대규모 언어 모델의 ‘가중치 효율적 파인튜닝(PEFT)’ 기법 중 하나인 LoRA(Low-Rank Adaptation)를 사용할 때의 주요 이점은 무엇인가요?

1. 모델의 전체 가중치를 동결하고 작은 행렬만 학습하여 학습 비용과 메모리 사용량을 크게 줄입니다.

2. 모델의 모든 레이어를 다시 학습시켜 최상의 성능을 보장합니다.

3. 사전 학습된 모델 없이 처음부터 완전히 새로운 모델을 학습합니다.

4. 입력 데이터를 수천 배로 확장하여 데이터 품질을 개선합니다.

Question 2

Databricks Foundation Model API를 사용하여 엔터프라이즈 환경에 모델을 배포할 때 얻을 수 있는 가장 큰 보안적 이점은 무엇입니까?

1. 고객의 프롬프트와 응답 데이터가 모델 학습에 재사용되지 않아 데이터 프라이버시가 보장됩니다.

2. 외부에 API 키를 공유할 수 있어 협업이 용이합니다.

3. 인터넷 연결 없이 오프라인 환경에서도 무제한으로 작동합니다.

4. 사용자의 데이터를 기반으로 실시간 파인튜닝이 자동으로 수행됩니다.

Question 3

검색 증강 생성(RAG) 시스템에서 검색 단계의 ‘재현율(Recall)’이 낮을 때 발생할 수 있는 주요 문제는 무엇인가요?

1. 시스템이 질문에 답하기 위해 반드시 필요한 관련 문서를 놓치고 검색하지 못합니다.

2. 너무 많은 문서를 검색하여 모델의 토큰 한도를 초과합니다.

3. 모델이 출력하는 문법적 오류가 급격히 증가합니다.

4. 검색 속도가 지나치게 느려져 타임아웃이 발생합니다.

Question 4

생성형 AI 애플리케이션에서 ‘프롬프트 인젝션(Prompt Injection)’ 공격을 방어하기 위한 가장 효과적인 아키텍처 수준의 접근 방식은 무엇입니까?

1. 입력과 출력을 필터링하는 전용 LLM 가드레일(Guardrails)을 시스템 앞단에 배치합니다.

2. LLM의 온도(Temperature)를 0으로 설정합니다.

3. 응답 길이를 항상 50단어 이내로 제한합니다.

4. 데이터베이스의 모든 사용자 비밀번호를 해싱합니다.

Question 5

Databricks MLflow의 ‘Evaluate’ 기능을 사용하여 LLM을 평가할 때, ‘Ground Truth’ 데이터 없이도 평가할 수 있는 지표는 무엇입니까?

1. 생성된 응답의 가독성(Readability) 및 독성(Toxicity).

2. ROUGE-L 점수.

3. 정확도(Accuracy).

4. 정밀도(Precision).

Question 6

문서를 벡터 데이터베이스에 인덱싱하기 전 ‘청킹(Chunking)’을 수행할 때, 청크 간에 겹치는 영역(Overlap)을 두는 주된 이유는 무엇인가요?

1. 문맥이 끊어지는 것을 방지하여 문장이나 의미가 잘려나가는 문제를 최소화하기 위함입니다.

2. 벡터 데이터베이스의 저장 용량을 줄이기 위해서입니다.

3. 임베딩 모델의 처리 속도를 가속화하기 위함입니다.

4. 문서 내의 오타를 자동으로 교정하기 위해서입니다.

Question 7

Databricks Unity Catalog 내에 등록된 모델을 특정 팀만 접근할 수 있도록 제어하려면 어떤 기능을 사용해야 합니까?

1. 역할 기반 접근 제어(RBAC)를 통해 모델에 대한 GRANT 권한을 설정합니다.

2. 모델 파일의 이름을 암호화하여 저장합니다.

3. 모델 서버의 IP 대역을 물리적으로 분리합니다.

4. 노트북(Notebook) 내부에 비밀번호를 하드코딩합니다.

Question 8

LLM의 하이퍼파라미터 중 ‘Top-P (Nucleus Sampling)’ 값을 0.1로 매우 낮게 설정했을 때 나타나는 결과는 무엇입니까?

1. 생성된 텍스트가 매우 결정론적(Deterministic)이고 예측 가능해집니다.

2. 모델이 완전히 무작위로 단어를 선택하여 창의성이 극대화됩니다.

3. 출력 텍스트의 길이가 설정된 값의 10%로 제한됩니다.

4. 훈련 단계에서의 학습 속도가 10배 빨라집니다.

Question 9

Databricks Vector Search를 사용할 때 인덱스 동기화(Sync) 방식으로 ‘Continuous’ 모드를 선택하면 어떤 장점이 있습니까?

1. 소스 Delta 테이블에 데이터가 추가되거나 변경될 때마다 벡터 인덱스가 실시간으로 자동 업데이트됩니다.

2. 수동으로 트리거해야만 인덱스가 업데이트되어 컴퓨팅 비용을 아낄 수 있습니다.

3. 원본 데이터를 모두 삭제해도 벡터 데이터가 영구적으로 보존됩니다.

4. 여러 벡터 데이터베이스 간의 동기화 충돌을 방지합니다.

Question 10

LangChain 에이전트(Agent)가 단순한 프롬프트 체인과 비교하여 가지는 가장 큰 차별점은 무엇인가요?

1. 에이전트는 LLM을 추론 엔진으로 사용하여 어떤 도구(Tools)를 언제 호출할지 동적으로 결정할 수 있습니다.

2. 에이전트는 항상 한 가지 답변만 반환하도록 고정되어 있습니다.

3. 외부 API나 도구에 접근하는 기능이 완전히 차단되어 있습니다.

4. 에이전트는 모델 학습을 담당하는 모듈입니다.

Question 11

시스템 아키텍처에서 ‘프로비저닝된 처리량(Provisioned Throughput)’ 모드로 LLM을 서빙할 때의 주요 특징은 무엇입니까?

1. 보장된 전용 컴퓨팅 리소스를 할당받아, 높은 트래픽에서도 일관된 지연 시간(Latency)을 보장합니다.

2. 사용한 토큰 수에 비례해서만 정확하게 과금되는 종량제 방식입니다.

3. 트래픽이 없을 때 컴퓨팅 리소스가 0으로 완전히 종료되어 비용이 청구되지 않습니다.

4. 오직 CPU만을 사용하여 추론을 수행합니다.

Question 12

개인 식별 정보(PII)가 포함된 콜센터 스크립트를 LLM의 학습 데이터로 사용하기 전, 가장 필수적으로 거쳐야 하는 데이터 파이프라인 단계는 무엇입니까?

1. 데이터 익명화 및 마스킹(Redaction)을 통한 민감 정보 제거.

2. 콜센터 오디오를 다시 생성하는 TTS(Text-to-Speech) 변환.

3. 텍스트를 모두 대문자로 변환하여 일관성 유지.

4. 모든 문서를 외국어로 번역.

Question 13

생성형 AI 엔지니어가 PDF에서 텍스트를 추출하려 합니다. 문서에 표와 다단 구성(Multi-column)이 복잡하게 얽혀 있을 때 추출 정확도를 높이기 위해 사용하는 기법은 무엇입니까?

1. 레이아웃 인식(Layout-aware) 구문 분석 도구를 사용하여 문서의 구조를 유지한 채 추출합니다.

2. 문서 전체를 단일 이미지로 변환 후 단순 텍스트로만 취급합니다.

3. 정규 표현식을 사용하여 표 기호를 모두 삭제합니다.

4. PDF의 암호를 해제하는 스크립트를 작성합니다.

Question 14

파운데이션 모델의 ‘파인튜닝(Fine-tuning)’과 RAG(Retrieval-Augmented Generation) 방식 중, 매일 업데이트되는 주식 시장 뉴스 애플리케이션에 더 적합한 아키텍처는 무엇이며 그 이유는 무엇입니까?

1. RAG; 모델을 매일 재학습시키지 않고도 외부 지식 베이스를 업데이트하여 최신 정보에 접근할 수 있기 때문입니다.

2. 파인튜닝; 매일 모델의 가중치를 업데이트하는 것이 가장 비용 효율적이기 때문입니다.

3. 파인튜닝; RAG는 텍스트가 아닌 이미지 분석에만 사용되기 때문입니다.

4. RAG; 모델의 추론 속도를 무제한으로 높일 수 있기 때문입니다.

Question 15

대규모 언어 모델 서빙에서 컨텍스트 윈도우 한계를 초과하는 입력 텍스트를 처리하는 가장 현실적인 방법은 무엇입니까?

1. 문서를 의미 있는 작은 덩어리(Chunk)로 나누고 핵심적인 요약이나 관련 청크만 모델에 전달합니다.

2. 에러가 나지 않도록 모델의 코드를 수정하여 컨텍스트 창을 강제로 2배 늘립니다.

3. 텍스트에서 모음을 모두 제거하여 토큰 수를 줄입니다.

4. API 호출 시간을 2배로 연장합니다.

Question 16

Databricks의 ‘System Prompts’를 올바르게 활용한 예시로 적절한 것은 무엇입니까?

1. “당신은 항상 친절하고 정확하게 대답하는 금융 전문가입니다. 모든 답변은 한국어로 제공하십시오.”라고 설정하여 모델의 일관된 페르소나와 동작 지침을 부여합니다.

2. 사용자가 입력하는 구체적인 질문 내용을 시스템 프롬프트에 하드코딩합니다.

3. 데이터베이스 접속 비밀번호를 시스템 프롬프트에 저장하여 필요시 호출합니다.

4. 응답을 출력한 후 시스템 프롬프트를 자동으로 삭제합니다.

Question 17

RAG 파이프라인에서 ‘Cross-encoder’를 Re-ranking(재정렬) 목적으로 사용할 때의 특징은 무엇입니까?

1. 사용자 질문과 검색된 문서를 동시에 입력받아 둘 간의 연관성 점수를 정밀하게 계산하지만, 계산 비용이 상대적으로 높습니다.

2. 문서와 질문을 독립적으로 임베딩하여 연산 속도가 매우 빠릅니다.

3. 텍스트를 이미지로 변환하여 시각적 유사도를 평가합니다.

4. 문서 검색 과정 자체를 완전히 생략할 수 있게 해줍니다.

Question 18

다음 중 생성형 AI 모델의 ‘환각(Hallucination)’을 줄이기 위한 프롬프트 엔지니어링 전략으로 올바른 것은?

1. “정보를 모를 경우 지어내지 말고 ‘모릅니다’라고 대답하세요”와 같은 명시적인 제약 조건을 제공합니다.

2. 모델의 창의성을 높이기 위해 Temperature 값을 1.0 이상으로 설정합니다.

3. 질문에 대한 구체적인 문맥 없이 매우 짧은 프롬프트만 입력합니다.

4. 가능한 한 다양한 주제를 한 번의 프롬프트에서 질문합니다.

Question 19

임베딩 벡터 간의 거리를 계산할 때 가장 널리 사용되며, 두 벡터 사이의 각도를 기반으로 방향적 유사성을 측정하는 지표는 무엇입니까?

1. 코사인 유사도 (Cosine Similarity)

2. 유클리디안 거리 (Euclidean Distance)

3. 맨해튼 거리 (Manhattan Distance)

4. 자카드 유사도 (Jaccard Similarity)

Question 20

Databricks의 RAG 구조에서 Delta Live Tables (DLT) 파이프라인의 역할로 가장 적절한 것은?

1. 원시 문서 데이터를 수집하고, 전처리(정제/청킹)하여 벡터화 가능한 형태의 Delta 테이블로 변환 및 유지 관리합니다.

2. 사용자 질문에 대한 최종 텍스트 응답을 생성합니다.

3. 외부 API 호출을 담당하는 에이전트 역할을 합니다.

4. 모델의 가중치를 저장하고 배포하는 역할을 수행합니다.

Question 21

대화형 LLM 애플리케이션에서 ‘대화 기록(Conversation Memory)’을 처리할 때 토큰 초과 문제를 해결하기 위한 방법 중 하나는?

1. 이전 대화 기록 전체를 입력하는 대신, LLM을 사용해 핵심 내용만 요약하여 프롬프트에 포함시킵니다.

2. 대화 기록을 로컬 텍스트 파일로 저장하고 프롬프트에서는 파일 경로만 전달합니다.

3. 모델의 시스템 프롬프트를 제거하여 여유 공간을 확보합니다.

4. 사용자가 이전 질문을 반복하도록 강제합니다.

Question 22

LLM 모델 출력의 ‘구조화(Structured Output)’가 필요할 때, 예를 들어 결과를 반드시 JSON 객체로 반환하게 하려면 프롬프트에 무엇을 포함해야 합니까?

1. 응답해야 할 JSON 키와 데이터 타입이 포함된 명확한 JSON 스키마 예시를 제공합니다.

2. JSON이라는 단어 없이 ‘프로그래밍 코드로 응답하라’고만 지시합니다.

3. 모델의 Temperature를 최고값으로 올립니다.

4. 출력 텍스트 길이를 최소화하여 괄호만 남게 만듭니다.

Question 23

파인튜닝 과정에서 ‘과적합(Overfitting)’이 발생하고 있다는 것을 알 수 있는 징후는 무엇입니까?

1. 학습 데이터에 대한 손실(Loss)은 계속 감소하지만, 검증(Validation) 데이터에 대한 손실은 증가하기 시작합니다.

2. 학습 데이터와 검증 데이터 모두에서 손실이 지속적으로 감소합니다.

3. 모델의 추론 속도가 눈에 띄게 빨라집니다.

4. 모델의 크기가 디스크 상에서 급격히 줄어듭니다.

Question 24

Databricks의 Unity Catalog를 사용할 때 RAG 시스템의 문서 열람 권한 보안을 어떻게 적용할 수 있습니까?

1. 소스 Delta 테이블의 행(Row) 및 열(Column) 수준 접근 제어를 통해 사용자의 권한에 맞는 데이터만 벡터 인덱싱 또는 검색되게 합니다.

2. 모델 자체에 비밀번호를 걸어 둡니다.

3. 검색 결과 텍스트의 글자 색상을 흰색으로 바꿔 숨깁니다.

4. 문서 접근 권한 제어는 클라이언트 애플리케이션 단에서만 100% 처리해야 합니다.

Question 25

언어 모델 추론 비용을 최적화하기 위해, 빈번하고 동일한 사용자 질문에 대한 API 비용을 획기적으로 줄이는 방법은 무엇입니까?

1. 의미론적 캐싱(Semantic Caching) 레이어를 도입하여 유사한 질문은 LLM 호출 없이 캐시에서 응답합니다.

2. 모델 파라미터를 임의로 절반 삭제합니다.

3. 사용자의 쿼리 길이를 무조건 3단어 이내로 제한합니다.

4. 응답 결과를 영어로만 반환하게 합니다.

Question 26

문서를 여러 덩어리로 나누는 Chunking 기법 중, 의미적 완전성을 보장하기 위해 단어가 아닌 ‘문장(Sentence)’이나 ‘단락(Paragraph)’ 경계를 기준으로 나누는 전략을 무엇이라 하나요?

1. 구조 인식 청킹 (Structure-aware Chunking) 또는 의미적 분할 (Semantic Splitting).

2. 고정 길이 청킹 (Fixed-length Chunking).

3. 문자 단위 청킹 (Character-level Chunking).

4. 무작위 청킹 (Random Chunking).

Question 27

오픈소스 LLM 모델을 Databricks에 배포할 때, 모델 파일들을 안전하고 효율적으로 저장 및 버전 관리하기 위한 최적의 저장소 위치는 어디입니까?

1. Unity Catalog Volumes (유니티 카탈로그 볼륨).

2. 개인 로컬 노트북 작업 공간.

3. 외부 개인 클라우드 드라이브 (예: Google Drive).

4. 임시 메모리 스토리지 (RAM).

Question 28

생성형 AI 모델의 출력 결과에 대해 사용자가 직접 ‘좋아요/싫어요’ 또는 수정된 답변을 제공하여 모델을 개선하는 학습 방식을 무엇이라 하나요?

1. 인간 피드백 기반 강화 학습 (RLHF: Reinforcement Learning from Human Feedback).

2. 비지도 학습 (Unsupervised Learning).

3. 제로샷 프롬프팅 (Zero-shot Prompting).

4. 사전 학습 (Pre-training).

Question 29

RAG 아키텍처에서 ‘Retriever’ 모듈을 평가할 때, 검색된 상위 K개의 문서 중에 실제로 정답을 포함하는 문서가 얼마나 존재하는지 파악하기 위해 사용하는 지표는?

1. Hit Rate (또는 Recall@K).

2. Perplexity.

3. BLEU Score.

4. Token Count.

Question 30

프롬프트 엔지니어링 기법 중, 모델에게 구체적인 예제(질문-답변 쌍)를 여러 개 제공한 후 최종 질문을 던지는 방식을 무엇이라 합니까?

1. 퓨샷 프롬프팅 (Few-Shot Prompting).

2. 제로샷 프롬프팅 (Zero-Shot Prompting).

3. 생각의 사슬 프롬프팅 (Chain-of-Thought).

4. 파인튜닝 (Fine-tuning).

Question 31

LLM 애플리케이션 로그 데이터를 관리할 때, 추론 요청 및 응답 본문(Payload)을 Databricks 내부의 델타 테이블로 자동 저장하여 모니터링하기 위한 기능은 무엇입니까?

1. 추론 테이블 (Inference Tables).

2. 델타 셰어링 (Delta Sharing).

3. 모델 레지스트리 (Model Registry).

4. 오토 로더 (Auto Loader).

Question 32

생성 모델이 학습하지 않은 최신 이벤트나 사내 기밀 문서를 기반으로 대답할 수 있게 만드는 가장 빠르고 효율적인 기술은 무엇입니까?

1. Retrieval-Augmented Generation (RAG).

2. 모델을 바닥부터 다시 훈련 (Pre-training from scratch).

3. 하이퍼파라미터 무작위 검색 (Random Search).

4. 토큰 크기 변경.

Question 33

문맥의 다단계 추론이 필요한 수학적, 논리적 문제를 해결하기 위해, 모델에게 “단계별로 생각해보자(Let’s think step by step)”와 같이 중간 추론 과정을 유도하는 기법은?

1. 생각의 사슬 프롬프팅 (Chain-of-Thought Prompting).

2. 제로샷 (Zero-shot).

3. 모델 프루닝 (Model Pruning).

4. 문서 청킹 (Document Chunking).

Question 34

Databricks Model Serving의 페이로드에서 모델 추론 결과 외에, 해당 응답이 생성되는 데 걸린 시간, 토큰 수 등의 추가 성능 정보를 파악하려면 응답 객체의 어떤 항목을 확인해야 합니까?

1. usage 및 metrics (메타데이터 객체).

2. temperature 파라미터.

3. top_p 값.

4. max_tokens 설정.

Question 35

LangChain 라이브러리에서 외부 데이터베이스 조회, 웹 검색, 수학 연산 등 특정한 행동을 수행하는 모듈을 캡슐화한 개념은 무엇입니까?

1. 도구 (Tools).

2. 프롬프트 템플릿 (Prompt Templates).

3. 출력 파서 (Output Parsers).

4. 문서 로더 (Document Loaders).

Question 36

임베딩 모델의 차원 수(Dimension)가 클 때 나타나는 주요 트레이드오프(Trade-off) 현상은 무엇입니까?

1. 의미적 표현력과 정확도는 증가하지만, 벡터 저장소의 스토리지 비용과 검색 연산 시간도 함께 증가합니다.

2. 정확도는 떨어지지만 연산 속도가 매우 빨라집니다.

3. 모델의 크기가 줄어들어 메모리를 덜 사용합니다.

4. 다국어 처리가 불가능해집니다.

Question 37

모델을 패키징할 때, Databricks MLflow에서 모델 추론 함수 실행 전후에 맞춤형 파이썬 로직(예: 전처리, 후처리)을 포함시키기 위해 사용하는 모델 래퍼(Wrapper) 형식은?

1. MLflow PyFunc 모듈 (Custom Python Model).

2. TensorFlow SavedModel.

3. ONNX 포맷.

4. Docker 이미지 직접 빌드.

Question 38

대규모 언어 모델이 학습 데이터에 없는 존재하지 않는 정보나 거짓 정보를 사실처럼 확신하며 대답하는 현상을 일컫는 용어는?

1. 환각 현상 (Hallucination).

2. 망각 (Catastrophic Forgetting).

3. 과적합 (Overfitting).

4. 역전파 (Backpropagation).

Question 39

텍스트 데이터를 작은 단위(예: 단어, 부분 단어)로 쪼개어 언어 모델이 처리할 수 있는 숫자로 변환하는 전처리 과정을 무엇이라 합니까?

1. 토큰화 (Tokenization).

2. 청킹 (Chunking).

3. 정규화 (Normalization).

4. 파싱 (Parsing).

Question 40

RAG 아키텍처의 성능 평가 시 고려되는 ‘생성(Generation)’ 지표 중, 응답 내용이 검색된 문서의 문맥 내에서만 유도되었는지를 파악하여 환각을 측정하는 지표는?

1. 충실도 (Faithfulness / Groundedness).

2. 대답 관련성 (Answer Relevance).

3. 검색 정밀도 (Retrieval Precision).

4. 토큰 처리량 (Token Throughput).

Question 41

사전 훈련된 모델의 가중치를 양자화(Quantization)와 병합하여 로딩 성능과 메모리 사용량을 줄이면서도 성능 저하를 최소화하는 대표적인 LoRA 결합 기법은?

1. QLoRA (Quantized LoRA).

2. RLHF.

3. Zero-shot 튜닝.

4. 데이터 증강 (Data Augmentation).

Question 42

Databricks 노트북 환경에서 LLM 호출이나 에이전트 체인의 실행 중간 과정(디버깅)을 시각적으로 추적(Trace)하기 위해 통합할 수 있는 유용한 오픈소스 프레임워크는?

1. MLflow Tracing (또는 LangSmith 등 추적 도구).

2. BeautifulSoup.

3. PyTorch.

4. NumPy.

Question 43

RAG 애플리케이션에서 사용자가 애매하거나 불완전한 질문을 했을 때, 채팅 기록을 참조하여 검색에 적합한 독립적이고 명확한 질문으로 재작성하는 과정을 무엇이라 합니까?

1. 질문 재작성 (Query Rewriting / Standalone Question Generation).

2. 문서 요약 (Document Summarization).

3. 의도 분류 (Intent Classification).

4. 응답 후처리 (Response Post-processing).

Question 44

모델의 편향(Bias)이나 독성(Toxicity)을 평가할 때, 사전에 정의된 유해한 단어나 문장의 목록에만 의존하는 방식이 가지는 가장 큰 단점은?

1. 문맥을 무시하기 때문에, 유해 단어가 없어도 문맥상 편향된 은유나 우회적 표현을 잡아내지 못합니다.

2. 연산 속도가 너무 느립니다.

3. 코딩 지식이 깊어야만 구현할 수 있습니다.

4. 데이터베이스 용량을 지나치게 많이 차지합니다.

Question 45

Databricks 플랫폼 내에서 생성형 AI 기반의 코드 자동 완성 및 데이터 인사이트 생성 기능으로 개발자의 생산성을 돕는 내장 AI 어시스턴트의 이름은?

1. Databricks Assistant (데이터브릭스 어시스턴트).

2. GitHub Copilot.

3. ChatGPT.

4. AWS CodeWhisperer.

데이터브릭스 AI 엔지니어 자격증 합격 팁

제공된 정답은 학습 보조용이므로 실제 시험의 출제 의도와 일부 다를 수 있습니다. 공식 문서와 함께 교차 검증을 권장하며, 이제 마지막 단계인 [데이터브릭스 생성형 AI 엔지니어 덤프 6/6]에서 최종 마무리하시길 바랍니다.

데이터브릭스 생성형 AI 엔지니어 자격증 기출 문제 덤프 5/6 (45문제)

데이터브릭스 AI 엔지니어 자격증 합격 팁

✅ 관련 글을 읽어보세요

Leave a Comment 응답 취소