Databricks Certified Generative AI Engineer 자격시험 합격을 위한 필수 관문, 덤프 3번째 세트입니다. 시중에서 구하기 어려운 최신 기출 경향을 완벽히 반영한 문제들로만 구성했습니다.
페이지 내에서 정답을 바로바로 체크하며 효율적으로 복습할 수 있어 학습 시간을 획기적으로 줄여줍니다. 눈으로 매끄럽게 훑어 내리며 개념을 다지고 실전에 완벽히 대비해 보세요.
참고해 주세요! 기출 덤프의 특성상 일부 문제나 선지, 정답에 오류가 있을 수 있습니다. 학습 시 이상한 점이 있다면 교재나 공식 문서를 통해 정답을 다시 한번 확인해 보시는 것을 추천합니다.”
데이터브릭스 생성형 AI 엔지니어 자격증 기출 문제 덤프 3/6 (45문제)
조직에서 프레임워크 유연성과 효율적인 리소스 할당을 결합하여 고성능 맞춤형 LLM 솔루션을 설계하려고 합니다. 아키텍처에 어떤 조합을 포함해야 할까요?
생성형 AI 엔지니어는 의료 RAG 파이프라인에서 환자 피드백을 요약하는 임무를 맡았습니다. 수집된 피드백의 일부에는 의료 기밀 정보가 포함되어 있습니다. 요약 파이프라인으로 전송하기 전에 민감한 보건 데이터를 어떻게 처리해야 할까요?
한 대형 금융 기관이 주식 시장 동향을 추적하는 RAG 파이프라인을 운영하고 있습니다. 검색 단계에서 심각한 병목 현상이 감지되었는데, 시스템 지연 시간이 급증했습니다. 검색 단계의 부하를 줄이기 위해 어떤 전략을 적용할 수 있을까요?
생성형 AI 엔지니어가 금융 분석을 도출하기 위해 여러 소스의 원본 데이터를 파싱하고 있습니다. 최종 문서 파이프라인의 완성도를 높이기 위해, 어떤 데이터 형식을 기본으로 채택해야 할까요?
한 팀이 실시간 고객 관리 챗봇용 에이전트 시스템을 배포하려고 합니다. 에이전트 성능을 실시간으로 벤치마킹하고 평가하기에 가장 적합한 도구 세트는 무엇일까요?
생성형 AI 엔지니어가 뉴스 피드를 바탕으로 자동 뉴스 요약을 제공하는 파이프라인을 구축했습니다. 요약본의 전반적인 품질을 측정하기 위해 어떤 정량적 평가 지표 조합을 채택해야 할까요?
다단계 LLM 추론 오케스트레이션 및 상태 관리를 구현할 때, 엔지니어가 아키텍처에 필수적으로 포함해야 하는 프레임워크는 무엇일까요?
생성형 AI 엔지니어가 원본 매뉴얼 데이터프레임을 벡터화하기 전에, 대용량 배열 구조를 레코드 단위로 고유하게 정렬하려고 합니다. 데이터프레임을 효과적으로 영속화하는 아키텍처 흐름은 무엇일까요?
Databricks 자격 증명 보안 정책에 따라 배포된 실시간 서비스 인프라에 API 비밀 키를 은닉하여 주입하고자 합니다. 엔지니어가 설정해야 하는 아키텍처 요소를 선택하세요.
사전 학습 모델과 도메인 지식 베이스를 활용하여 대화 서비스의 응답 지연 시간(Latency)을 단축하고 처리량 비용을 최적화하기 위해, 엔지니어가 구현해야 할 필수 설계 항목은 무엇일까요?
생성형 AI 엔지니어가 엔터프라이즈 Unity Catalog 환경에 최신 학습 LLM 아키텍처 버전을 로깅하고 중앙 관리 플랫폼으로 안전하게 전달하는 올바른 구현 순서는 무엇일까요?
긴 문서 구조에서 토큰 최대 수용량을 보존하고 텍스트의 맥락적 단편화(Context Fragmentation) 문제를 근본적으로 완화하기 위해 적용하는 가장 직접적인 모델 아키텍처 특성은 무엇일까요?
생성형 AI 엔지니어가 특수 도메인 지식 매뉴얼 텍스트의 의미적 매칭 정확도를 비약적으로 증대시키고자 합니다. RAG 아키텍처 성능 고도화를 위해 고려해야 할 가장 효과적인 수정 조치는 무엇일까요?
대화형 비즈니스 파이프라인에서 정형화된 작업 관리 지침, 마감 기한 및 책임 할당 데이터를 비정형 텍스트 소스로부터 정확하게 파싱하여 출력 구조를 정형화하는 최적의 설계 기법은 무엇일까요?
과거 거래 기록, 메타데이터 정보 및 사용자 구매 이력을 정밀 연산하여 벡터 검색 매칭 정확도를 극대화하는 파이프라인 아키텍처 조합은 무엇입니까?
의료 정보 질의응답 시스템의 신뢰도 향상을 위해 설계 엔지니어가 최우선으로 검증하고 추적해야 하는 핵심 정성적 보안 평가 지표는 무엇일까요?
생성형 AI 엔지니어가 의료 상담 가이드라인 어시스턴트에 환각 및 무허가 의료 진단 행위를 차단하는 방어 알고리즘을 빌드하고자 합니다. 프롬프트 단에서 설정해야 하는 필수 설계 기법은 무엇일까요?
LangChain 다단계 대화 체인을 구성할 때, 여러 세션에 걸친 이전 사용자 대화 기록과 컨텍스트 상태 정보를 안전하게 공유하기 위해 통합해야 하는 핵심 클래스 요소는 무엇일까요? (두 가지를 선택하세요)
복수 선택생성형 AI 엔지니어가 뉴스 아티팩트 정리 과정에서 발생한 쓸모없는 웹 광고 스크랩 텍스트와 비정형 쓰레기 메타데이터를 원천 차단하고자 합니다. 데이터 클렌징 단계에서 가장 추천되는 직접적인 완화 방식은 무엇일까요?
타사에서 입수한 오픈 데이터셋 문서들을 RAG 파이프라인에 대량 병합하는 과정에서 악의적이고 오염된 허위 정보 문서 팩이 섞여 있는 것을 발견했습니다. 파이프라인의 오염을 방지하기 위한 보안 조치는 무엇일까요?
생성형 AI 엔지니어가 사내 정밀 제품 설명서 지식 문서에서 RAG 검색 단계의 불필요한 노이즈와 잘못된 마케팅 문장들을 소거하려고 합니다. 최우선적으로 적용해야 하는 청킹 전처리 원칙은 무엇일까요?
엔터프라이즈 사내 법률 기밀 보장 규정에 맞추어 RAG 서비스 엔드포인트의 데이터 이동 및 저장소 트래픽 전 구간을 완벽하게 보호하는 다중 보안 통제 방식은 무엇입니까? (두 가지를 선택하세요)
복수 선택RAG 파이프라인의 핵심인 정보 검색 시스템의 효율성을 다차원 분석하고 오답률 병목 구간을 탐지하기 위해 모니터링해야 하는 정량적 평가지표 메트릭 그룹은 무엇일까요?
생성형 AI 엔지니어가 비정형 고객 불만 수집 데이터셋 파이프라인을 구축하던 중, 일부 욕설 섞인 문장들과 공격적인 언어를 사전에 걸러내고자 합니다. 어떤 조치가 적절할까요?
생성형 AI 엔지니어가 수집 데이터의 개인정보 유출 리스크를 미연에 차단하기 위해 원본 피드백 데이터셋 내의 전화번호, 주소, 실명을 은닉하고자 합니다. 획득할 수 있는 이점은 무엇입니까?
생성형 AI 엔지니어가 이미지 형식(JPG/PNG)으로 저장된 기업 스캔 영수증 파일들로부터 내부 텍스트 자산을 온전히 복구하여 파싱하고자 합니다. 필수 패키지 아키텍처 조합은 무엇입니까?
사내 계약서 정보 분석을 위한 에이전트 시스템에서 유효 문서를 탐색하는 리트리버 지연 시간(Latency) 지표가 과도하게 늘어나는 장애가 감지되었습니다. 원인 진단을 위해 추적해야 할 메트릭은 무엇일까요?
생성형 AI 엔지니어가 보험 상품 설명 챗봇 엔진을 개발하던 중, 모델이 임의로 허위 사실이나 유포 금지 조항을 지어내서 유저에게 출력하는 환각(Hallucination) 현상을 원천 방지하고자 합니다. 어떤 보완 조치가 가장 확실할까요?
대규모 엔터프라이즈 환경에서 RAG 챗봇 서비스를 상용급으로 운영 및 동적 스케일링하기 위해 인프라 설계 단에서 확보해야 하는 가장 필수적인 리소스 자원 조합은 무엇일까요?
사내 고객 피드백 상시 수집 인프라를 상용 배포한 상태에서 실시간 비즈니스 효율과 실제 유저 만족도를 계측하기 위해 관제 대시보드에 연동해야 하는 핵심 실시간 라이브 지표는 무엇일까요?
생성형 AI 엔지니어가 사내 재무 정밀 보고서 데이터셋 가공 과정에서 스캔 문서 표 영역에 뒤섞여 있는 투명 워터마크 노이즈와 희미한 배경 로고 이미지를 전처리 단계에서 소거하고자 합니다. 어떤 방식이 정답입니까?
지식 매뉴얼 RAG 솔루션을 안정적으로 구동하기 위한 LLM 모델 제품군을 비교 검증할 때, 최우선적으로 매칭을 검토해야 하는 아키텍처 요구 명세는 무엇일까요?
생성형 AI 엔지니어가 금융 규제 법규 해석 가이드를 지원하는 실시간 지능형 질의응답 솔루션을 구성하고자 합니다. 의미 매칭 품질의 한계를 극복하고 노이즈 문서를 자동 필터링하기 위한 대안 설계는 무엇일까요?
생성형 AI 엔지니어가 사내 가용 인력 풀 비정형 이력 텍스트와 실시간 프로젝트 타임라인 지식 명세 데이터를 교차 매칭하여, 빈 프로젝트에 최적의 엔지니어를 가공 및 추천하는 파이프라인 아키텍처를 설계하고자 합니다. 올바른 방식은 무엇입니까?
생성형 AI 엔지니어가 사내 지식 스토리지 내의 비정형 문서 팩을 파싱하여 대화형 어시스턴트 서비스에 연동하고자 합니다. 데이터 마이그레이션 효율을 고려할 때, 원본 벡터들을 고정 적재하는 가장 정확한 순서의 파이프라인 아키텍처는 무엇일까요?
사내 규제 및 보안 통제 규정에 의거하여 기밀 유지 서약서 및 기외 외부 노출 차단 문서를 기반으로 상용 챗봇을 설계하려 합니다. 어떠한 클라우드 외부 트래픽 노출도 금지된 상태에서 최고의 정확도를 달성할 수 있는 자체 온프레미스 인프라 용 대형 파라미터 모델 규격은 무엇일까요?
생성형 AI 엔지니어가 사내 신규 장치 사양서 텍스트의 구조와 대화 흐름을 유기적으로 결합하여 다회차 질문 대답(Multi-turn)이 가능한 오케스트레이션 체인을 빌드하려고 합니다. 필수 결합 요소는 무엇일까요? (두 가지를 선택하세요)
복수 선택Databricks 자격증 시험 가이드 명세에 기재된 대규모 지식 데이터 동기화 함수 체계 중 기본 관리형 가중치 모델을 활용한 델타 테이블 인덱스 실시간 동기화 호출 명령어는 무엇일까요?
생성형 AI 엔지니어가 배포된 대화 솔루션의 비정형 답변의 텍스트 왜곡 유무와 원문 유사성 보존 비율을 기계적으로 연산 및 자동 검증하고자 합니다. 최적의 메트릭은 무엇입니까?
생성형 AI 엔지니어가 다단계 대화 인터페이스에서 외부 결합 시스템이나 백엔드 인프라 데이터 조회를 유기적으로 실행하기 위해 프롬프트 구조에 도구 세트를 명시하고자 합니다. 어떤 결합 방식이 정답입니까?
대용량 텍스트 파이프라인 전처리 과정에서 수집된 비정형 텍스트 내에 포함된 불필요한 개행 문자, 노이즈 특수 기호 및 공백 배열을 원천 무효화하여 토큰 소모량을 최적화하는 아키텍처 접근은 무엇일까요?
생성형 AI 엔지니어가 복잡하게 중첩된 다차원 표(Tables) 구조와 다양한 폰트 단락이 포함된 비정형 웹 HTML 문서 매뉴얼 파일셋으로부터 정보 왜곡 없이 고성능으로 원문 문장을 파싱하고자 합니다. 최적의 컴포넌트는 무엇입니까?
생성형 AI 엔지니어가 소스 코드 보조 자동 생성 솔루션을 사내 개발 조직에 구축 배포하려 합니다. 다국어 소스 제어 문법을 완벽히 이해하고 구조적 프로그래밍 컨텍스트 해석 능력이 입증된 최적의 배포 모델은 무엇입니까?
생성형 AI 엔지니어가 서빙 인프라 모델 교체 공정 진행 중, 프롬프트 입력 제한 한계선(Token Limit) 규격을 초과하여 400번 대 잘못된 요청(InvalidArgument) 에러가 반환되는 현상을 목격했습니다. 즉시 조치해야 하는 아키텍처 변경 요소는 무엇일까요? (두 가지를 선택하세요)
복수 선택비정형 법률 조항 텍스트 파일셋 내의 특정 핵심 리스크 정보 및 권리 의무 귀속 관계 문장들을 분류 및 추출하여 정형화된 보고서 개요 데이터로 전환하기 위한 필수 알고리즘 컴포넌트 조합은 무엇입니까? (두 가지를 선택하세요)
복수 선택데이터브릭스 AI 엔지니어 자격증 합격 팁
표시된 정답은 학습 참고용이므로 실제 시험의 출제 의도와 일부 다를 수 있으니 공식 가이드를 함께 교차 검증하시는 것을 추천합니다. 다음 단계인 [데이터브릭스 생성형 AI 엔지니어 덤프 4/6] 포스팅에서 다음 문제를 이어 푸실 수 있습니다.