데이터브릭스 생성형 AI 엔지니어 자격증(Databricks Generative AI Engineer Associate)을 준비하시는 분들을 위해 어렵게 구한 최신 기출문제 덤프를 공유합니다. 저 역시 이 덤프 문제들을 집중적으로 회독하여 단번에 합격할 수 있었습니다.
블로그 안에서 문제를 읽고 아래의 버튼을 누르면 정답을 즉시 체크할 수 있도록 편리하게 구성했습니다. 시험 전에 가볍게 스크롤을 내리며 실전처럼 풀어보시고 꼭 합격하시길 응원합니다!
데이터브릭스 생성형 AI 엔지니어 자격증 기출 문제 덤프 1/6 (45문제)
생성형 AI 엔지니어는 사용자 쿼리를 정규화하고 불필요한 기호를 제거하는 맞춤형 LLM 애플리케이션용 전처리 파이프라인을 개발해야 합니다. 어떤 접근 방식을 사용해야 할까요?
생성형 AI 엔지니어는 RAG 애플리케이션에 사용할 법률 텍스트를 청킹하고 인덱싱하는 작업을 맡았습니다. 법률 텍스트에는 긴 섹션이 포함되어 있으며, 일부는 토큰 제한을 초과합니다. 최적의 청킹 전략은 무엇일까요?
생성형 AI 엔지니어가 애플리케이션을 배포했지만, 할당된 처리량에 비해 요청량이 부족한 것을 발견했습니다. 어떻게 하면 배포 비용 효율성을 확보할 수 있을까요?
암 연구 분야의 소규모 스타트업 기업이 비용 효율성을 중시하며 파운데이션 모델 API를 활용한 RAG 애플리케이션 구축을 추진하고 있습니다. 어떻게 하면 비용 효율성을 유지하면서도 고품질 애플리케이션을 만들 수 있을까요?
생성형 AI 엔지니어가 최신 주식 뉴스 기사에 대한 질문에 답하는 시스템을 구축하고 있습니다. 하지만 이 시스템은 출력 결과가 금융 뉴스와 관련성이 있도록 보장하는 데는 도움이 되지 않습니다.
생성형 AI 엔지니어가 LLM을 사용하여 이메일에서 형식화된 JSON을 생성하려고 합니다. 이를 위해서는 주문 ID, 날짜, 발신자 이메일 주소를 파싱하고 추출해야 합니다.
다음은 샘플 이메일입니다.
날짜: 2024년 4월 23일 시간: 오후 4시 22분 발신자: anjali.thayer@example.com 수신자: support@company.com 제목: 배송 정보
안녕하세요, 배송 건이 있습니다(주문 ID는 CD34RFT입니다). 업데이트를 보내주시겠습니까? 감사합니다, 안잘리.
엔지니어는 출력 정확도를 최대한 높여 관련 정보를 JSON 형식으로 추출하는 프롬프트를 작성해야 합니다. 어떤 프롬프트가 이러한 목표를 달성할 수 있을까요?
생성형 AI 엔지니어가 게임 회사의 온라인 게임 플레이 중 사용자 참여를 유도하는 챗봇을 설계하고 있습니다. 어떤 지표가 참여도와 유지율을 높이는 데 도움이 될까요?
생성형 AI 엔지니어는 학술 연구 논문을 요약하는 모델의적합성을 평가해야 합니다. 평가에는 의미론적 정확성과 도메인 관련성이 고려되어야 합니다. 어떤 방법을 우선적으로 고려해야 할까요? (두 가지를 선택하세요)
복수 선택생성형 AI 엔지니어가 사용자의 이름을 기반으로 맞춤형 생일 시를 생성하는 LLM 애플리케이션을 개발하고 있습니다. 악의적인 사용자 입력 가능성을 고려할 때, 이 애플리케이션을 보호하는 데 가장 효과적인 기술은 무엇일까요?
생성형 AI 엔지니어는 잠재적 위험을 평가하기 위해 법률 계약을 분석하는 추론 시스템을 설계해야 합니다. 이 시스템은 위험 조항을 강조 표시하고, 대체 문구를 제안하며, 핵심 용어를 요약해야 합니다. 어떤 도구를 포함해야 할까요? (두 가지를 선택하세요)
복수 선택생성형 AI 엔지니어가 대규모 고객 지원 티켓 데이터셋을 위한 RAG 애플리케이션을 개발하고 있습니다. 그러나 이 애플리케이션은 답변이 잘리거나 충분한 세부 정보가 부족한 등 불완전한 응답을 생성합니다. 엔지니어는 이 문제를 해결하기 위해 어떤 전략을 적용해야 할까요? (두 가지를 선택하세요)
복수 선택생성형 AI 엔지니어가 환자 대상 의료 정보 챗봇을 개발하고 있습니다. 환자의 질문이 응급 상황이 아닌 경우, 챗봇은 추가 정보를 요청하고 관련 자료를 추천해야 합니다. 질문이 긴급한 경우, 환자를 응급 서비스로 안내해야 합니다. “지난 이틀 동안 심한 두통과 어지럼증을 겪고 있습니다.”라는 입력이 주어졌을 때, 어떤 답변이 가장 적절할까요?
생성형 AI 엔지니어가 현재 PDF 형식의 소스 문서에서 추출한 컨텍스트에 의존하는 RAG 애플리케이션을 개발하고 있습니다. 이 PDF 문서에는 텍스트와 이미지가 모두 포함될 수 있습니다. 엔지니어는 최소한의 코드로 솔루션을 개발하고자 합니다. 소스 문서에서 텍스트를 추출하는 데 어떤 Python 패키지를 사용해야 할까요?
생성형 AI 엔지니어는 식단 계획을 생성하는 챗봇의 사용자 입력을 보강하는 임무를 맡았습니다. 이 시스템은 사용자가 제공한 재료와 식단 제한 사항을 활용하여 식단을 추천해야 합니다. 입력값을 어떻게 보강해야 할까요? (두 가지를 선택하세요)
복수 선택생성형 AI 엔지니어가 사용자의 검색어와 관련된 1918년 뉴스 기사를 검색하고 요약하는 LLM 시스템을 개발하고 있습니다. 그러나 요약 내용에 생성 방식에 대한 설명이 포함되는 경우가 있는데, 이는 바람직하지 않습니다. 이 문제를 해결하기 위해 엔지니어는 어떤 변경 사항을 구현해야 할까요?
생성형 AI 엔지니어는 운영 환경의 델타 테이블에 저장된 고객 거래 데이터를 사용하는 RAG 애플리케이션을 개선하는 임무를 맡았습니다. 팀은 보안을 손상시키거나 운영 환경 성능에 영향을 주지 않으면서 실제 데이터를 사용하여 개발 환경에서 변경 사항을 테스트해야 합니다. Databricks에서 가장 적합한 접근 방식은 무엇일까요?
생성형 AI 엔지니어가 Databricks에서 LLM 모델을 학습시켰고, 이를 배포하려고 합니다. Databricks에 모델을 배포하는 가장 쉬운 방법은 무엇일까요?
생성형 AI 엔지니어가 최신 뉴스 기사와 주가를 필요로 하는 애플리케이션을 개발하고 있습니다. 이 시스템을 어떻게 설계해야 할까요?
생성형 AI 엔지니어는 HTML 기반 사용자 설명서에서 콘텐츠를 추출하는 작업을 맡았습니다. 설명서에는 중첩된 표 안에 제품 세부 정보가 포함되어 있습니다. 텍스트 추출에 가장 적합한 도구는 무엇일까요? (두 가지를 선택하세요)
복수 선택생성형 AI 엔지니어가 회사 내 소규모 전문가 그룹을 위한 RAG 애플리케이션 개발을 맡았습니다. 이 애플리케이션은 내부 지식 기반을 활용하여 민감하고 기밀스러운 질문에 답변해야 합니다. 사용자 그룹 규모가 작기 때문에 지연 시간과 처리량은 문제가 되지 않지만, 고품질 답변이 최우선 과제입니다. 또한, 규제 요건에 따라 어떠한 정보도 제3자에게 전송할 수 없습니다. 이러한 모든 요구 사항을 충족하는 모델은 무엇일까요?
생성형 AI 엔지니어가 벡터 스토어 설정을 테스트하기 위해 아래 코드를 사용하고 있습니다.
from databricks.vector_search.client import VectorSearchClient
vsc = VectorSearchClient()
vsc.create_endpoint(name=”vector_search_test”, endpoint_type=”STANDARD”)
이 엔지니어가 기본 임베딩 모델을 사용하는 Databricks 관리 임베딩을 사용하려고 한다고 가정할 때, 다음으로 호출해야 할 함수는 무엇일까요?
생성형 AI 엔지니어에게 인사 관련 PDF 문서를 활용하여 직원 인사 질문에 답하는 LLM 기반 애플리케이션을 설계하라는 요청이 있었습니다. 생성형 AI 엔지니어가 설계해야 하는 시스템은 어떤 주요 작업들을 수행해야 할까요?
LLM으로 보내기 전에 사용자 지정 코드를 사용하여 프롬프트를 전처리하는 효과적인 방법은 무엇입니까?
생성형 AI 엔지니어가 자신이 좋아하는 몬스터 트럭 팀을 위한 에이전트 기반 LLM 시스템을 개발하고 있습니다. 이 시스템은 팀에 대한 텍스트 기반 질문에 답변하고, API 호출을 통해 이벤트 날짜를 조회하거나, 팀의 최신 순위 정보를 표에서 확인할 수 있습니다. 생성형 AI 엔지니어는 이러한 기능을 시스템에 어떻게 가장 효과적으로 설계할 수 있을까요?
생성형 AI 엔지니어는 고객 지원 챗봇에 사용할 프롬프트-응답 쌍을 평가해야 합니다. 모델의 작업과의 일치를 보장하는 데 가장 중요한 기준은 무엇입니까? (두 가지를 선택하세요)
복수 선택생성형 AI 엔지니어가 SnoPen AI의 내부 문서에 대한 질문에 답하는 RAG 애플리케이션을 개발하고 있습니다. 소스 문서에는 광고나 회사와 무관한 정보와 같은 관련 없는 내용이 포함될 수 있습니다. 관련 없는 정보를 필터링하는 데 어떤 접근 방식이 적절할까요?
생성형 AI 엔지니어는 제품 재고가 있으면 ‘재고 있음’, 재고가 없으면 ‘재고 없음’을 출력하도록 설계된 LLM과 상호 작용합니다. 엔지니어는 통화 분류 레이블에 맞게 출력 형식을 지정하는 프롬프트를 구현해야 합니다. 어떤 프롬프트가 가장 적합할까요?
생성형 AI 엔지니어가 직원들이 내부 지식 기반에서 답변을 검색할 수 있는 RAG 애플리케이션을 개발했습니다. 이제 시스템 성능을 공식적으로 평가하려고 합니다. 시스템을 어떻게 평가해야 할까요?
생성형 AI 엔지니어는 외부 챗봇에 대한 다음과 같은 비즈니스 요구사항을 받았습니다. 챗봇은 사용자가 어떤 유형의 질문을 하는지 파악하고, 질문에 답하기 위해 적절한 모델을 연결해야 합니다. 예를 들어, 사용자는 예정된 이벤트 정보나 티켓 구매에 대해 질문할 수 있습니다. 이러한 챗봇에 이상적인 워크플로는 무엇일까요?
생성형 AI 엔지니어가 기술 연구 논문의 요약을 생성하는 LLM 애플리케이션을 개발하고 있습니다. 이 요약의 품질을 평가하기 위해 어떤 지표를 사용해야 할까요?
생성형 AI 엔지니어에게 LLM 기반 질의응답 애플리케이션 개발이 의뢰되었습니다. 이 애플리케이션은 자주 게시되는 새로운 문서를 고려해야 합니다. 엔지니어는 최소한의 비용, 최소한의 개발 노력, 그리고 최소한의 운영 비용으로 이 애플리케이션을 구축하고자 합니다. 이러한 요구 사항을 충족하는 구성 요소 연결 및 구성 조합은 무엇일까요?
생성형 AI 엔지니어는 레스토랑의 온라인 예약 고객 경험을 개선하기 위해 일반적인 고객 문의를 자동으로 처리하는 LLM 기반 솔루션을 구축하고자 합니다. 이 솔루션의 목표는 개인화된 상호 작용을 유지하면서 사람의 개입이나 전화 통화로 이어지는 상황을 최소화하는 것입니다. 솔루션을 설계하기 위해 생성형 AI 엔지니어는 LLM에 입력할 데이터와 수행해야 할 작업을 정의해야 합니다. 어떤 입력/출력 쌍이 목표 달성에 가장 적합할까요?
한 팀에서 소프트웨어 개발자를 위한 코드 생성 보조 모델을 만들고자 합니다. 이 모델은 여러 프로그래밍 언어를 지원해야 하며, 품질이 최우선 목표입니다. Databricks Foundation Model API 또는 Marketplace에서 제공되는 모델 중 어떤 것이 가장 적합할까요?
생성형 AI 엔지니어는 사용자 지정 MLflow Pyfunc 모델을 활용하여 중간 결과를 반환하는 애플리케이션을 배포해야 합니다. 비밀 키와 자격 증명을 전달하도록 엔드포인트를 어떻게 구성해야 할까요?
생성형 AI 엔지니어가 비정형 문서를 성공적으로 청크 단위로 분할했고, 이 청크들을 벡터 검색 인덱스에 저장하려고 합니다. 현재 데이터프레임은 원본 문서 이름과 텍스트 청크 배열을 저장하는 열로 구성되어 있습니다. 이 데이터프레임을 저장하는 가장 효율적인 방법은 무엇일까요?
다단계 LLM 기반 워크플로우 구축에 가장 적합한 라이브러리는 무엇입니까?
생성형 AI 엔지니어가 새로 정의된 프로젝트에 가장 적합한 팀원을 추천하는 생성형 AI 시스템을 구축하고 있습니다. 추천 대상은 프로젝트 일정의 가용성과 프로필이 프로젝트 범위와 얼마나 잘 부합하는지를 고려해야 합니다. 직원 프로필과 프로젝트 범위는 모두 비정형 텍스트 형식으로 저장되어 있습니다. 어떤 시스템 아키텍처를 사용하는 것이 적절할까요?
생성형 AI 엔지니어가 LLM 기반 번역 애플리케이션이 생성한 번역물의 품질을 평가하고 있습니다. 번역의 정확도를 평가하기 위해 어떤 지표를 사용해야 할까요?
생성형 AI 엔지니어가 사용자가 새로운 스포츠를 배우면서 기술 규정에 대한 질문에 답을 찾을 수 있도록 돕는 RAG 애플리케이션을 설계하고 있습니다. 이 애플리케이션을 구축하고 배포하려면 어떤 단계를 순서대로 따라야 할까요?
생성형 AI 엔지니어가 아래 코드를 사용하여 LangChain에서 간단한 프롬프트 템플릿을 테스트하는 중 오류가 발생했습니다. 코드는 다음과 같습니다.
from langchain.chains import LLMChain
from langchain_community.llms import OpenAI
from langchain_core.prompts import PromptTemplate
prompt_template = “Tell me a {adjective} joke”
prompt = PromptTemplate(input_variables=[“adjective”], template=prompt_template )
llm = LLMChain(prompt=prompt)
llm.generate([{“adjective”: “funny”}])
API 키가 올바르게 정의되었다고 가정할 때, 생성형 AI 엔지니어는 오류를 수정하기 위해 어떤 부분을 변경해야 할까요?
생성형 AI 엔지니어가 시적인 어조(예: 하이쿠)로 기사 요약을 생성하는 시스템을 개발 중입니다. 하지만 생성된 요약이 원하는 어조나 스타일에 맞지 않습니다. 다음 중 어떤 접근 방식이 문제 해결에 도움이 되지 않을까요?
생성형 AI 엔지니어가 전자상거래 플랫폼을 위한 사기 탐지 시스템을 개발하고 있습니다. 이 시스템은 LLM을 사용하여 텍스트 설명, 고객 이력 및 거래 메타데이터를 기반으로 의심스러운 거래를 표시합니다. 엔지니어는 여러 모델 실험을 추적하고, 성능 지표를 기록하며, 선택된 모델이 프로덕션 환경에 쉽게 배포될 수 있도록 보장하고자 합니다. 어떤 접근 방식을 사용하는 것이 좋을까요?
생성형 AI 엔지니어가 실시간 업데이트 및 분석을 제공하는 LLM 기반 라이브 스포츠 해설 플랫폼을 설계하고 있습니다. 이 플랫폼은 잠재적으로 오래된 기사에 의존하는 대신 실시간 경기 점수를 기반으로 요약을 생성하는 것을 목표로 합니다. 이러한 경기 분석을 생성하는 데 필요한 실시간 데이터에 접근할 수 있도록 해주는 도구는 무엇일까요?
생성형 AI 엔지니어는 LLM과 벡터 스토어를 통합한 고객 지원용 RAG 애플리케이션을 배포하는 임무를 맡았습니다. 이 애플리케이션은 데이터 개인정보보호 규정을 준수해야 합니다. 어떤 규정 준수 조치가 중요한가요? (두 가지를 선택하세요)
복수 선택대규모 컨텍스트 윈도우를 지원하는 LLM은?