Databricks Certified Generative AI Engineer 자격증 취득을 위한 덤프 5번째 시리즈입니다. 실전 시험의 난이도를 반영한 기출 유형들로 학습 효율을 극대화하세요.
반복적인 문제 풀이는 자격증 합격을 위한 가장 확실한 방법입니다. 페이지 내 정답 기능을 활용해 막힘없이 학습을 이어가시길 바랍니다.
참고해 주세요! 기출 덤프의 특성상 일부 문제나 선지, 정답에 오류가 있을 수 있습니다. 학습 시 이상한 점이 있다면 교재나 공식 문서를 통해 정답을 다시 한번 확인해 보시는 것을 추천합니다.”
데이터브릭스 생성형 AI 엔지니어 자격증 기출 문제 덤프 5/6 (45문제)
대규모 언어 모델의 ‘가중치 효율적 파인튜닝(PEFT)’ 기법 중 하나인 LoRA(Low-Rank Adaptation)를 사용할 때의 주요 이점은 무엇인가요?
Databricks Foundation Model API를 사용하여 엔터프라이즈 환경에 모델을 배포할 때 얻을 수 있는 가장 큰 보안적 이점은 무엇입니까?
검색 증강 생성(RAG) 시스템에서 검색 단계의 ‘재현율(Recall)’이 낮을 때 발생할 수 있는 주요 문제는 무엇인가요?
생성형 AI 애플리케이션에서 ‘프롬프트 인젝션(Prompt Injection)’ 공격을 방어하기 위한 가장 효과적인 아키텍처 수준의 접근 방식은 무엇입니까?
Databricks MLflow의 ‘Evaluate’ 기능을 사용하여 LLM을 평가할 때, ‘Ground Truth’ 데이터 없이도 평가할 수 있는 지표는 무엇입니까?
문서를 벡터 데이터베이스에 인덱싱하기 전 ‘청킹(Chunking)’을 수행할 때, 청크 간에 겹치는 영역(Overlap)을 두는 주된 이유는 무엇인가요?
Databricks Unity Catalog 내에 등록된 모델을 특정 팀만 접근할 수 있도록 제어하려면 어떤 기능을 사용해야 합니까?
LLM의 하이퍼파라미터 중 ‘Top-P (Nucleus Sampling)’ 값을 0.1로 매우 낮게 설정했을 때 나타나는 결과는 무엇입니까?
Databricks Vector Search를 사용할 때 인덱스 동기화(Sync) 방식으로 ‘Continuous’ 모드를 선택하면 어떤 장점이 있습니까?
LangChain 에이전트(Agent)가 단순한 프롬프트 체인과 비교하여 가지는 가장 큰 차별점은 무엇인가요?
시스템 아키텍처에서 ‘프로비저닝된 처리량(Provisioned Throughput)’ 모드로 LLM을 서빙할 때의 주요 특징은 무엇입니까?
개인 식별 정보(PII)가 포함된 콜센터 스크립트를 LLM의 학습 데이터로 사용하기 전, 가장 필수적으로 거쳐야 하는 데이터 파이프라인 단계는 무엇입니까?
생성형 AI 엔지니어가 PDF에서 텍스트를 추출하려 합니다. 문서에 표와 다단 구성(Multi-column)이 복잡하게 얽혀 있을 때 추출 정확도를 높이기 위해 사용하는 기법은 무엇입니까?
파운데이션 모델의 ‘파인튜닝(Fine-tuning)’과 RAG(Retrieval-Augmented Generation) 방식 중, 매일 업데이트되는 주식 시장 뉴스 애플리케이션에 더 적합한 아키텍처는 무엇이며 그 이유는 무엇입니까?
대규모 언어 모델 서빙에서 컨텍스트 윈도우 한계를 초과하는 입력 텍스트를 처리하는 가장 현실적인 방법은 무엇입니까?
Databricks의 ‘System Prompts’를 올바르게 활용한 예시로 적절한 것은 무엇입니까?
RAG 파이프라인에서 ‘Cross-encoder’를 Re-ranking(재정렬) 목적으로 사용할 때의 특징은 무엇입니까?
다음 중 생성형 AI 모델의 ‘환각(Hallucination)’을 줄이기 위한 프롬프트 엔지니어링 전략으로 올바른 것은?
임베딩 벡터 간의 거리를 계산할 때 가장 널리 사용되며, 두 벡터 사이의 각도를 기반으로 방향적 유사성을 측정하는 지표는 무엇입니까?
Databricks의 RAG 구조에서 Delta Live Tables (DLT) 파이프라인의 역할로 가장 적절한 것은?
대화형 LLM 애플리케이션에서 ‘대화 기록(Conversation Memory)’을 처리할 때 토큰 초과 문제를 해결하기 위한 방법 중 하나는?
LLM 모델 출력의 ‘구조화(Structured Output)’가 필요할 때, 예를 들어 결과를 반드시 JSON 객체로 반환하게 하려면 프롬프트에 무엇을 포함해야 합니까?
파인튜닝 과정에서 ‘과적합(Overfitting)’이 발생하고 있다는 것을 알 수 있는 징후는 무엇입니까?
Databricks의 Unity Catalog를 사용할 때 RAG 시스템의 문서 열람 권한 보안을 어떻게 적용할 수 있습니까?
언어 모델 추론 비용을 최적화하기 위해, 빈번하고 동일한 사용자 질문에 대한 API 비용을 획기적으로 줄이는 방법은 무엇입니까?
문서를 여러 덩어리로 나누는 Chunking 기법 중, 의미적 완전성을 보장하기 위해 단어가 아닌 ‘문장(Sentence)’이나 ‘단락(Paragraph)’ 경계를 기준으로 나누는 전략을 무엇이라 하나요?
오픈소스 LLM 모델을 Databricks에 배포할 때, 모델 파일들을 안전하고 효율적으로 저장 및 버전 관리하기 위한 최적의 저장소 위치는 어디입니까?
생성형 AI 모델의 출력 결과에 대해 사용자가 직접 ‘좋아요/싫어요’ 또는 수정된 답변을 제공하여 모델을 개선하는 학습 방식을 무엇이라 하나요?
RAG 아키텍처에서 ‘Retriever’ 모듈을 평가할 때, 검색된 상위 K개의 문서 중에 실제로 정답을 포함하는 문서가 얼마나 존재하는지 파악하기 위해 사용하는 지표는?
프롬프트 엔지니어링 기법 중, 모델에게 구체적인 예제(질문-답변 쌍)를 여러 개 제공한 후 최종 질문을 던지는 방식을 무엇이라 합니까?
LLM 애플리케이션 로그 데이터를 관리할 때, 추론 요청 및 응답 본문(Payload)을 Databricks 내부의 델타 테이블로 자동 저장하여 모니터링하기 위한 기능은 무엇입니까?
생성 모델이 학습하지 않은 최신 이벤트나 사내 기밀 문서를 기반으로 대답할 수 있게 만드는 가장 빠르고 효율적인 기술은 무엇입니까?
문맥의 다단계 추론이 필요한 수학적, 논리적 문제를 해결하기 위해, 모델에게 “단계별로 생각해보자(Let’s think step by step)”와 같이 중간 추론 과정을 유도하는 기법은?
Databricks Model Serving의 페이로드에서 모델 추론 결과 외에, 해당 응답이 생성되는 데 걸린 시간, 토큰 수 등의 추가 성능 정보를 파악하려면 응답 객체의 어떤 항목을 확인해야 합니까?
LangChain 라이브러리에서 외부 데이터베이스 조회, 웹 검색, 수학 연산 등 특정한 행동을 수행하는 모듈을 캡슐화한 개념은 무엇입니까?
임베딩 모델의 차원 수(Dimension)가 클 때 나타나는 주요 트레이드오프(Trade-off) 현상은 무엇입니까?
모델을 패키징할 때, Databricks MLflow에서 모델 추론 함수 실행 전후에 맞춤형 파이썬 로직(예: 전처리, 후처리)을 포함시키기 위해 사용하는 모델 래퍼(Wrapper) 형식은?
대규모 언어 모델이 학습 데이터에 없는 존재하지 않는 정보나 거짓 정보를 사실처럼 확신하며 대답하는 현상을 일컫는 용어는?
텍스트 데이터를 작은 단위(예: 단어, 부분 단어)로 쪼개어 언어 모델이 처리할 수 있는 숫자로 변환하는 전처리 과정을 무엇이라 합니까?
RAG 아키텍처의 성능 평가 시 고려되는 ‘생성(Generation)’ 지표 중, 응답 내용이 검색된 문서의 문맥 내에서만 유도되었는지를 파악하여 환각을 측정하는 지표는?
사전 훈련된 모델의 가중치를 양자화(Quantization)와 병합하여 로딩 성능과 메모리 사용량을 줄이면서도 성능 저하를 최소화하는 대표적인 LoRA 결합 기법은?
Databricks 노트북 환경에서 LLM 호출이나 에이전트 체인의 실행 중간 과정(디버깅)을 시각적으로 추적(Trace)하기 위해 통합할 수 있는 유용한 오픈소스 프레임워크는?
RAG 애플리케이션에서 사용자가 애매하거나 불완전한 질문을 했을 때, 채팅 기록을 참조하여 검색에 적합한 독립적이고 명확한 질문으로 재작성하는 과정을 무엇이라 합니까?
모델의 편향(Bias)이나 독성(Toxicity)을 평가할 때, 사전에 정의된 유해한 단어나 문장의 목록에만 의존하는 방식이 가지는 가장 큰 단점은?
Databricks 플랫폼 내에서 생성형 AI 기반의 코드 자동 완성 및 데이터 인사이트 생성 기능으로 개발자의 생산성을 돕는 내장 AI 어시스턴트의 이름은?
데이터브릭스 AI 엔지니어 자격증 합격 팁
제공된 정답은 학습 보조용이므로 실제 시험의 출제 의도와 일부 다를 수 있습니다. 공식 문서와 함께 교차 검증을 권장하며, 이제 마지막 단계인 [데이터브릭스 생성형 AI 엔지니어 덤프 6/6]에서 최종 마무리하시길 바랍니다.