데이터브릭스 생성형 AI 엔지니어 자격증 기출 문제 덤프 1/6 (45문제)

데이터브릭스 생성형 AI 엔지니어 자격증(Databricks Generative AI Engineer Associate)을 준비하시는 분들을 위해 어렵게 구한 최신 기출문제 덤프를 공유합니다. 저 역시 이 덤프 문제들을 집중적으로 회독하여 단번에 합격할 수 있었습니다.

블로그 안에서 문제를 읽고 아래의 버튼을 누르면 정답을 즉시 체크할 수 있도록 편리하게 구성했습니다. 시험 전에 가볍게 스크롤을 내리며 실전처럼 풀어보시고 꼭 합격하시길 응원합니다!

“참고해 주세요! 기출 덤프의 특성상 일부 문제나 선지, 정답에 오류가 있을 수 있습니다. 학습 시 이상한 점이 있다면 교재나 공식 문서를 통해 정답을 다시 한번 확인해 보시는 것을 추천합니다.”

데이터브릭스 생성형 AI 엔지니어 자격증 기출 문제 덤프 1/6 (45문제)

Question 1

생성형 AI 엔지니어는 사용자 쿼리를 정규화하고 불필요한 기호를 제거하는 맞춤형 LLM 애플리케이션용 전처리 파이프라인을 개발해야 합니다. 어떤 접근 방식을 사용해야 할까요?

1. PyFunc 모델을 작성하여 전처리 로직을 구현하고 이를 LLM 애플리케이션과 통합하십시오.

2. Spark 작업을 사용하여 사용자 쿼리를 정규화하고 전처리합니다.

3. Delta Live Table을 사용하여 사용자 쿼리를 LLM으로 전달하기 전에 사전 처리하십시오.

4. LLM을 미세 조정하여 사용자 쿼리를 내부적으로 사전 처리합니다.

Question 2

생성형 AI 엔지니어는 RAG 애플리케이션에 사용할 법률 텍스트를 청킹하고 인덱싱하는 작업을 맡았습니다. 법률 텍스트에는 긴 섹션이 포함되어 있으며, 일부는 토큰 제한을 초과합니다. 최적의 청킹 전략은 무엇일까요?

1. 제목과 부제목을 기준으로 텍스트를 논리적인 섹션으로 분할하고, 각 섹션이 토큰 제한을 초과하지 않도록 합니다.

2. 각 문서를 하나의 덩어리로 처리합니다.

3. 구조는 고려하지 않고 텍스트를 동일한 크기의 덩어리로 나눕니다.

4. 컨텍스트 보존을 위해 모든 청크를 30%씩 겹치도록 합니다.

Question 3

생성형 AI 엔지니어가 애플리케이션을 배포했지만, 할당된 처리량에 비해 요청량이 부족한 것을 발견했습니다. 어떻게 하면 배포 비용 효율성을 확보할 수 있을까요?

1. 토큰당 처리량 지불 방식을 사용하여 모델을 배포하세요. 이 방식은 비용 보장이 제공됩니다.

2. 하드웨어 제약을 줄이기 위해 매개변수가 더 적은 모델로 변경하십시오.

3. 외부 모델을 사용하도록 전환하세요.

4. 속도 제한 문제를 방지하려면 들어오는 요청 배치를 수동으로 조절하십시오.

Question 4

암 연구 분야의 소규모 스타트업 기업이 비용 효율성을 중시하며 파운데이션 모델 API를 활용한 RAG 애플리케이션 구축을 추진하고 있습니다. 어떻게 하면 비용 효율성을 유지하면서도 고품질 애플리케이션을 만들 수 있을까요?

1. 고객이 하루에 보낼 수 있는 문의 횟수를 제한하세요.

2. 특정 분야에 특화된 더 작은 규모의 LLM을 선택하세요.

3. 최상의 성능을 위해서는 가장 큰 LLM 값을 사용하십시오.

4. 검색 가능한 관련 문서의 수를 제한하십시오.

Question 5

생성형 AI 엔지니어가 최신 주식 뉴스 기사에 대한 질문에 답하는 시스템을 구축하고 있습니다. 하지만 이 시스템은 출력 결과가 금융 뉴스와 관련성이 있도록 보장하는 데는 도움이 되지 않습니다.

1. 금융 부문에 맞춘 콘텐츠 필터 정책을 포함하는 포괄적인 안전장치 체계를 구축하십시오.

2. 사용자에게 전송하기 전에 문제가 있는 출력물 수정하기 위해 수동 검토를 포함시키십시오.

3. 컴퓨팅 성능을 높여 질문 처리 속도를 개선하고, 더 높은 관련성 분석을 가능하게 하십시오.

4. 욕설 필터를 구현하여 불쾌한 언어를 걸러내세요.

Question 6

생성형 AI 엔지니어가 LLM을 사용하여 이메일에서 형식화된 JSON을 생성하려고 합니다. 이를 위해서는 주문 ID, 날짜, 발신자 이메일 주소를 파싱하고 추출해야 합니다.

다음은 샘플 이메일입니다.
날짜: 2024년 4월 23일 시간: 오후 4시 22분 발신자: anjali.thayer@example.com 수신자: support@company.com 제목: 배송 정보
안녕하세요, 배송 건이 있습니다(주문 ID는 CD34RFT입니다). 업데이트를 보내주시겠습니까? 감사합니다, 안잘리.

엔지니어는 출력 정확도를 최대한 높여 관련 정보를 JSON 형식으로 추출하는 프롬프트를 작성해야 합니다. 어떤 프롬프트가 이러한 목표를 달성할 수 있을까요?

1. 고객 이메일을 수신하고, 해당 이메일에서 날짜, 발신자 이메일 주소, 주문 ID를 추출해야 합니다. 추출된 정보는 JSON 형식으로 반환하세요.

2. 고객 이메일을 수신하고 날짜, 발신자 이메일 주소, 주문 ID를 추출해야 합니다. 추출된 정보는 사람이 읽기 쉬운 형식으로 반환하세요.

3. 고객 이메일을 수신하고 날짜, 발신자 이메일 주소, 주문 ID를 추출해야 합니다. 추출된 정보는 JSON 형식으로 반환하세요. 예시는 다음과 같습니다. {“date”: “April 16, 2024”, “sender_email”: “john.doe@example.com”, “order_id”: “ORD98765”}.

4. 고객 이메일을 수신하고 날짜, 발신자 이메일 주소, 주문 ID를 추출해야 합니다. 추출한 날짜, 발신자 이메일 주소, 주문 ID 정보는 JSON 형식으로 반환해야 합니다.

Question 7

생성형 AI 엔지니어가 게임 회사의 온라인 게임 플레이 중 사용자 참여를 유도하는 챗봇을 설계하고 있습니다. 어떤 지표가 참여도와 유지율을 높이는 데 도움이 될까요?

1. 응답의 반복

2. 관련성 부족

3. 무작위성

4. 다양한 답변

Question 8

생성형 AI 엔지니어는 학술 연구 논문을 요약하는 모델의적합성을 평가해야 합니다. 평가에는 의미론적 정확성과 도메인 관련성이 고려되어야 합니다. 어떤 방법을 우선적으로 고려해야 할까요? (두 가지를 선택하세요)

복수 선택

1. 유창성을 평가하기 위해 perplexity을 측정합니다.

2. BLEU를 사용하여 참조 텍스트와의 유사도를 측정하십시오.

3. 토큰 사용량을 평가하여 비용을 최적화하십시오.

4. 요약 내용의 도메인 정확성을 평가하기 위해 사람 평가를 수행합니다.

5. 콘텐츠 중복 분석에는 ROUGE를 사용하고, 의미 정확도 측정에는 도메인별 지표를 활용하세요.

Question 9

생성형 AI 엔지니어가 사용자의 이름을 기반으로 맞춤형 생일 시를 생성하는 LLM 애플리케이션을 개발하고 있습니다. 악의적인 사용자 입력 가능성을 고려할 때, 이 애플리케이션을 보호하는 데 가장 효과적인 기술은 무엇일까요?

1. LLM의 연산 능력을 향상시켜 입력값을 더 빠르게 처리하세요.

2. LLM에게 해당 입력이 악의적임을 사용자에게 상기시키되, 사용자와 대화를 계속하도록 요청하십시오.

3. 유해한 입력을 감지하는 안전 필터를 구현하고, LLM에게 지원할 수 없다는 응답을 요청합니다.

4. 사용자가 LLM과 상호 작용할 수 있는 시간을 줄이세요.

Question 10

생성형 AI 엔지니어는 잠재적 위험을 평가하기 위해 법률 계약을 분석하는 추론 시스템을 설계해야 합니다. 이 시스템은 위험 조항을 강조 표시하고, 대체 문구를 제안하며, 핵심 용어를 요약해야 합니다. 어떤 도구를 포함해야 할까요? (두 가지를 선택하세요)

복수 선택

1. 위험 수준별로 조항을 분류하는 분류 모델

2. 계약서 조항을 사용자가 쉽게 이해할 수 있도록 안내하는 의사결정 트리

3. 위험 조항을 대화형으로 강조 표시하는 시각화 도구입니다.

4. 계약 조항을 의미론적으로 분석하기 위한 임베딩 모델

5. 법적 판례 또는 대체 조항 템플릿을 검색하는 시스템

Question 11

생성형 AI 엔지니어가 대규모 고객 지원 티켓 데이터셋을 위한 RAG 애플리케이션을 개발하고 있습니다. 그러나 이 애플리케이션은 답변이 잘리거나 충분한 세부 정보가 부족한 등 불완전한 응답을 생성합니다. 엔지니어는 이 문제를 해결하기 위해 어떤 전략을 적용해야 할까요? (두 가지를 선택하세요)

복수 선택

1. LLM 과정에서 더 관리하기 쉬운 맥락을 제공하기 위해 문서 덩어리의 크기를 줄이십시오.

2. 응답 오류를 최소화하려면 검색되는 데이터 조각의 수를 제한하십시오.

3. 더 큰 임베딩 모델을 사용하여 임베딩 품질과 문서 검색 성능을 향상세요.

4. 문서의 청크 크기를 늘려 문맥의 단편화를 줄이세요.

5. 검색 시 문맥 관련성을 높이기 위해 청크에 세그먼트 레이블(예: 섹션 제목)을 추가하세요.

Question 12

생성형 AI 엔지니어가 환자 대상 의료 정보 챗봇을 개발하고 있습니다. 환자의 질문이 응급 상황이 아닌 경우, 챗봇은 추가 정보를 요청하고 관련 자료를 추천해야 합니다. 질문이 긴급한 경우, 환자를 응급 서비스로 안내해야 합니다. “지난 이틀 동안 심한 두통과 어지럼증을 겪고 있습니다.”라는 입력이 주어졌을 때, 어떤 답변이 가장 적절할까요?

1. 나이, 최근 활동 내역, 두통 및 어지럼증과 함께 나타난 다른 증상이 있으면 알려주시기 바랍니다.

2. 지역 응급 서비스에 연락하십시오.

3. 다음은 참고하실 만한 관련 기사 몇 개입니다. 읽어보시고 궁금한 점이 있으면 알려주세요.

4. 두통은 정말 힘들죠. 빨리 나으시길 바랍니다!

Question 13

생성형 AI 엔지니어가 현재 PDF 형식의 소스 문서에서 추출한 컨텍스트에 의존하는 RAG 애플리케이션을 개발하고 있습니다. 이 PDF 문서에는 텍스트와 이미지가 모두 포함될 수 있습니다. 엔지니어는 최소한의 코드로 솔루션을 개발하고자 합니다. 소스 문서에서 텍스트를 추출하는 데 어떤 Python 패키지를 사용해야 할까요?

1. BeautifulSoup

2. numpy

3. unstructured

4. flask

Question 14

생성형 AI 엔지니어는 식단 계획을 생성하는 챗봇의 사용자 입력을 보강하는 임무를 맡았습니다. 이 시스템은 사용자가 제공한 재료와 식단 제한 사항을 활용하여 식단을 추천해야 합니다. 입력값을 어떻게 보강해야 할까요? (두 가지를 선택하세요)

복수 선택

1. 질문에 식사량 및 식사 선호도와 같은 추가적인 맥락을 포함하세요.

2. 분류 모델을 사용하여 사용자 입력을 분류합니다.

3. 사용자 입력 내용을 요약하여 핵심 사항을 정리합니다.

4. 규칙 기반 시스템을 학습시켜 고정 식단 계획을 추천하세요.

5. 질문에 유사한 식단 예시를 추가하세요.

Question 15

생성형 AI 엔지니어가 사용자의 검색어와 관련된 1918년 뉴스 기사를 검색하고 요약하는 LLM 시스템을 개발하고 있습니다. 그러나 요약 내용에 생성 방식에 대한 설명이 포함되는 경우가 있는데, 이는 바람직하지 않습니다. 이 문제를 해결하기 위해 엔지니어는 어떤 변경 사항을 구현해야 할까요?

1. LLM 출력 결과를 줄 바꿈 문자를 기준으로 분할하여 요약 설명을 제거합니다.

2. 뉴스 기사의 청크 크기를 조정하거나 다양한 임베딩 모델을 실험해 보세요.

3. 원하는 출력 형식의 예시 이미지를 시스템이나 사용자에게 제공하십시오.

4. 문서 수집 로직을 재검토하여 뉴스 기사가 제대로 수집되는지 확인하십시오.

Question 16

생성형 AI 엔지니어는 운영 환경의 델타 테이블에 저장된 고객 거래 데이터를 사용하는 RAG 애플리케이션을 개선하는 임무를 맡았습니다. 팀은 보안을 손상시키거나 운영 환경 성능에 영향을 주지 않으면서 실제 데이터를 사용하여 개발 환경에서 변경 사항을 테스트해야 합니다. Databricks에서 가장 적합한 접근 방식은 무엇일까요?

1. Delta 테이블 전체를 수정 없이 개발 환경으로 복사합니다.

2. Databricks의 Delta Sharing 기능을 사용하여 개발 환경에서 프로덕션 Delta 테이블에 대한 제한된 쿼리 액세스 권한을 부여할 수 있습니다.

3. 실시간 테스트를 위해 개발 환경을 프로덕션 Delta 테이블로 직접 연결하십시오.

4. Databricks의 Unity Catalog를 사용하여 접근 제어 및 민감한 필드에 대한 데이터 마스킹 기능을 갖춘 개발 전용 프로덕션 데이터 보기를 생성할 수 있습니다.

5. Databricks 내에서 생성된, 실제 데이터의 스키마 및 일반적인 특성을 모방한 합성 데이터 세트를 사용하십시오.

Question 17

생성형 AI 엔지니어가 Databricks에서 LLM 모델을 학습시켰고, 이를 배포하려고 합니다. Databricks에 모델을 배포하는 가장 쉬운 방법은 무엇일까요?

1. 모델을 로컬에 저장하고, Docker 이미지를 빌드하고, Docker 컨테이너를 실행합니다.

2. 학습 중에 MLflow를 사용하여 모델을 로깅하고, MLflow API를 사용하여 Unity 카탈로그에 직접 등록하고, 서비스 엔드포인트를 시작합니다.

3. LLM을 Flask 앱으로 래핑하고 Gunicorn을 사용하여 제공하세요.

4. 모델을 pickle 객체로 로깅하고, Unity 카탈로그 볼륨에 업로드하고, MLflow에 등록하고, 서비스 엔드포인트를 시작합니다.

Question 18

생성형 AI 엔지니어가 최신 뉴스 기사와 주가를 필요로 하는 애플리케이션을 개발하고 있습니다. 이 시스템을 어떻게 설계해야 할까요?

1. Delta 테이블에 대한 SQL 쿼리 및 웹 검색 도구를 갖춘 에이전트를 생성합니다. 검색된 값을 LLM에 제공하여 응답을 생성합니다.

2. 뉴스 기사와 주가를 벡터 저장소에 다운로드하고 저장합니다. RAG 아키텍처를 사용하여 런타임에 응답을 검색하고 생성합니다.

3. 델타 테이블에서 주가를 조회하고 LLM을 사용하여 주가 변동성 분석을 위한 검색 쿼리를 생성합니다.

4. LLM을 사용하여 뉴스 기사를 요약하고 주식 티커를 검색하여 주가를 찾으세요.

Question 19

생성형 AI 엔지니어는 HTML 기반 사용자 설명서에서 콘텐츠를 추출하는 작업을 맡았습니다. 설명서에는 중첩된 표 안에 제품 세부 정보가 포함되어 있습니다. 텍스트 추출에 가장 적합한 도구는 무엇일까요? (두 가지를 선택하세요)

복수 선택

1. pdfplumber를 사용하여 테이블 데이터를 추출합니다.

2. 대용량 HTML 문서를 더 빠르게 구문 분석하고 처리하기 위한 LXML입니다.

3. OCR 기반 텍스트 추출을 위한 pytesseract.

4. BeautifulSoup는 HTML을 파싱하고 구조화된 요소에서 텍스트를 추출하는 데 사용됩니다.

5. PyPDF2를 사용하여 사용자 설명서의 텍스트를 읽어옵니다.

Question 20

생성형 AI 엔지니어가 회사 내 소규모 전문가 그룹을 위한 RAG 애플리케이션 개발을 맡았습니다. 이 애플리케이션은 내부 지식 기반을 활용하여 민감하고 기밀스러운 질문에 답변해야 합니다. 사용자 그룹 규모가 작기 때문에 지연 시간과 처리량은 문제가 되지 않지만, 고품질 답변이 최우선 과제입니다. 또한, 규제 요건에 따라 어떠한 정보도 제3자에게 전송할 수 없습니다. 이러한 모든 요구 사항을 충족하는 모델은 무엇일까요?

1. OpenAI GPT-4

2. BGE-large

3. Dolly 1.5B

4. Llama2-70B

Question 21

생성형 AI 엔지니어가 벡터 스토어 설정을 테스트하기 위해 아래 코드를 사용하고 있습니다.
from databricks.vector_search.client import VectorSearchClient
vsc = VectorSearchClient()
vsc.create_endpoint(name=”vector_search_test”, endpoint_type=”STANDARD”)
이 엔지니어가 기본 임베딩 모델을 사용하는 Databricks 관리 임베딩을 사용하려고 한다고 가정할 때, 다음으로 호출해야 할 함수는 무엇일까요?

1. vsc.similarity_search()

2. vsc.create_direct_access_index()

3. vsc.create_delta_sync_index()

4. vsc.get_index()

Question 22

생성형 AI 엔지니어에게 인사 관련 PDF 문서를 활용하여 직원 인사 질문에 답하는 LLM 기반 애플리케이션을 설계하라는 요청이 있었습니다. 생성형 AI 엔지니어가 설계해야 하는 시스템은 어떤 주요 작업들을 수행해야 할까요?

1. LLM을 사용하여 인사 관련 문서를 요약하세요. 문서 요약과 사용자 질의를 LLM에 입력하고, 충분한 컨텍스트 창을 제공하여 사용자에게 응답을 생성하세요.

2. 각 HR 문서에 대한 평균 임베딩을 계산하고, 임베딩을 사용자 쿼리와 비교하여 최적의 문서를 찾습니다. 최적의 문서와 사용자 쿼리를 큰 컨텍스트 창을 가진 LLM에 전달하여 직원에게 응답을 생성합니다.

3. 인사 관련 문서를 여러 부분으로 나누어 벡터 저장소에 저장합니다. 직원 질문을 사용하여 질문과 가장 일치하는 문서 부분을 검색하고, LLM을 사용하여 검색된 문서를 기반으로 직원에게 답변을 생성합니다.

4. 과거 직원 질문과 인사 문서 간의 상호작용 매트릭스를 생성합니다. ALS를 사용하여 매트릭스를 분해하고 임베딩을 생성합니다. 새로운 질문의 임베딩을 계산하고 이를 활용하여 최적의 인사 문서를 찾습니다. LLM을 사용하여 검색된 문서를 기반으로 직원 질문에 대한 답변을 생성합니다.

Question 23

LLM으로 보내기 전에 사용자 지정 코드를 사용하여 프롬프트를 전처리하는 효과적인 방법은 무엇입니까?

1. LLM은 전처리된 프롬프트 예제로 학습되지 않았으므로 프롬프트 전처리를 위해 사용자 지정 코드를 도입하지 않는 것이 좋습니다.

2. 프롬프트를 사전 처리하는 것보다 LLM 출력 결과를 사후 처리하여 원하는 결과에 맞추는 것이 더 효과적입니다.

3. LLM의 내부 아키텍처를 직접 수정하여 전처리 단계를 포함시키십시오.

4. 프롬프트를 처리하는 별도의 함수를 포함하는 MLflow PyFunc 모델을 작성하세요.

Question 24

생성형 AI 엔지니어가 자신이 좋아하는 몬스터 트럭 팀을 위한 에이전트 기반 LLM 시스템을 개발하고 있습니다. 이 시스템은 팀에 대한 텍스트 기반 질문에 답변하고, API 호출을 통해 이벤트 날짜를 조회하거나, 팀의 최신 순위 정보를 표에서 확인할 수 있습니다. 생성형 AI 엔지니어는 이러한 기능을 시스템에 어떻게 가장 효과적으로 설계할 수 있을까요?

1. 몬스터 트럭 팀에 관한 PDF 문서를 벡터 저장소에 저장하고 RAG 아키텍처에서 쿼리합니다.

2. 시스템 프롬프트에 모든 가능한 이벤트 날짜와 테이블 정보를 포함하는 프롬프트를 구축하십시오. RAG 아키텍처를 사용하여 일반 텍스트 질문을 조회하고 시스템 프롬프트의 정보를 활용하십시오.

3. LLM에게 쿼리에 따라 “RAG”, “API” 또는 “TABLE”로 응답하도록 지시한 다음 텍스트 구문 분석 및 조건문을 사용하여 쿼리를 해결합니다.

4. 에이전트가 사용 가능한 도구를 나열하는 시스템 프롬프트를 작성하고, 이를 여러 호출을 실행하여 쿼리를 해결하는 에이전트 시스템에 통합하십시오.

Question 25

생성형 AI 엔지니어는 고객 지원 챗봇에 사용할 프롬프트-응답 쌍을 평가해야 합니다. 모델의 작업과의 일치를 보장하는 데 가장 중요한 기준은 무엇입니까? (두 가지를 선택하세요)

복수 선택

1. 고객 문의와 즉각적으로 관련된 답변을 제공하십시오.

2. 질의의 모든 측면을 다루는 완전한 답변

3. 토큰 사용 효율성을 높여 계산 비용을 절감합니다.

4. 맥락을 제공하기 위해 자세한 설명을 요청하십시오.

5. 다양성 확보를 위해 응답을 무작위로 추출했습니다.

Question 26

생성형 AI 엔지니어가 SnoPen AI의 내부 문서에 대한 질문에 답하는 RAG 애플리케이션을 개발하고 있습니다. 소스 문서에는 광고나 회사와 무관한 정보와 같은 관련 없는 내용이 포함될 수 있습니다. 관련 없는 정보를 필터링하는 데 어떤 접근 방식이 적절할까요?

1. SnoPen AI 관련 문서를 모두 벡터 데이터베이스의 단일 덩어리로 통합합니다.

2. 데이터 필터링을 수행하지 않더라도 시스템에서 확인하는 모든 정보는 SnoPen AI에 관한 것임을 시스템 메시지에 포함시키십시오.

3. RAG 애플리케이션은 회사 관련 내용이 아닌 콘텐츠를 이해해야 하므로 모든 문서를 보관하십시오. 그렇지 않으면 관련 질문에 답변해야 하는 상황이 발생할 수 있습니다.

4. 시스템 메시지에 해당 애플리케이션이 SnoPen AI와 관련 없는 질문에는 답변해서는 안 된다는 내용을 포함시키세요.

Question 27

생성형 AI 엔지니어는 제품 재고가 있으면 ‘재고 있음’, 재고가 없으면 ‘재고 없음’을 출력하도록 설계된 LLM과 상호 작용합니다. 엔지니어는 통화 분류 레이블에 맞게 출력 형식을 지정하는 프롬프트를 구현해야 합니다. 어떤 프롬프트가 가장 적합할까요?

1. 고객이 제품을 문의하면 “재고 있음”이라고 답변하세요.

2. 고객이 특정 제품을 문의하면 “품절”이라고 응답하세요.

3. 고객이 제품 재고 여부를 문의하는 통화 녹취록이 제공됩니다. 제품이 재고가 있으면 “재고 있음”으로, 재고가 없으면 “재고 없음”으로 답변하십시오.

4. 고객이 제품 재고 여부를 문의하는 통화 녹취록이 제공됩니다. 출력 결과는 “재고 있음” 또는 “재고 없음”입니다. 출력 형식은 JSON 형식이어야 합니다. 예: {“call_id”: “123”, “label”: “In Stock”}

Question 28

생성형 AI 엔지니어가 직원들이 내부 지식 기반에서 답변을 검색할 수 있는 RAG 애플리케이션을 개발했습니다. 이제 시스템 성능을 공식적으로 평가하려고 합니다. 시스템을 어떻게 평가해야 할까요?

1. 코사인 유사도 점수를 사용하여 최종 생성된 답변의 품질을 종합적으로 평가합니다.

2. 검색 및 생성 기능을 각각 테스트할 수 있도록 데이터셋을 구성하세요. MLflow의 내장 평가 지표를 사용하여 평가를 진행하세요.

3. LLM 전문가를 심사위원으로 활용하여 최종 답변의 질을 평가하십시오.

4. 동일한 데이터를 사용하여 여러 LLM 프로그램을 벤치마킹하고 해당 업무에 가장 적합한 LLM 프로그램을 선택하십시오.

Question 29

생성형 AI 엔지니어는 외부 챗봇에 대한 다음과 같은 비즈니스 요구사항을 받았습니다. 챗봇은 사용자가 어떤 유형의 질문을 하는지 파악하고, 질문에 답하기 위해 적절한 모델을 연결해야 합니다. 예를 들어, 사용자는 예정된 이벤트 정보나 티켓 구매에 대해 질문할 수 있습니다. 이러한 챗봇에 이상적인 워크플로는 무엇일까요?

1. 서로 다른 유형의 사용자 문의를 처리하는 두 개의 서로 다른 챗봇이 있어야 합니다.

2. 챗봇은 결제 처리만 담당해야 합니다.

3. 챗봇은 이전 이벤트 정보만 참조해야 합니다.

4. 챗봇은 다단계 LLM 워크플로로 구현되어야 합니다. 먼저 질문 유형을 파악한 후, 해당 질문을 적절한 모델로 전달합니다. 예를 들어, 예정된 이벤트 관련 질문이라면 텍스트를 SQL로 변환하는 모델로 문의를 보내고, 티켓 구매 관련 질문이라면 결제 플랫폼으로 연결해야 합니다.

Question 30

생성형 AI 엔지니어가 기술 연구 논문의 요약을 생성하는 LLM 애플리케이션을 개발하고 있습니다. 이 요약의 품질을 평가하기 위해 어떤 지표를 사용해야 할까요?

1. ROUGE

2. BLEU

3. Word Count

4. Latency

Question 31

생성형 AI 엔지니어에게 LLM 기반 질의응답 애플리케이션 개발이 의뢰되었습니다. 이 애플리케이션은 자주 게시되는 새로운 문서를 고려해야 합니다. 엔지니어는 최소한의 비용, 최소한의 개발 노력, 그리고 최소한의 운영 비용으로 이 애플리케이션을 구축하고자 합니다. 이러한 요구 사항을 충족하는 구성 요소 연결 및 구성 조합은 무엇일까요?

1. 이 애플리케이션을 실행하려면 프롬프트, 리트리버 및 LLM이 필요합니다. 리트리버의 출력은 프롬프트에 삽입되고, 이 프롬프트는 LLM에 제공되어 답변을 생성합니다.

2. LLM 과정은 최신 정보를 제공하기 위해 새로운 문서들을 반영하여 지속적으로 수정 및 보완되어야 합니다.

3. 질문 답변 애플리케이션의 경우, 답변을 생성하기 위해 신속한 엔지니어링과 LLM이 필요합니다.

4. 이 애플리케이션을 실행하려면 프롬프트, 에이전 및 정밀하게 조정된 LLM이 필요합니다. 에이전트는 LLM이 프롬프트에 삽입될 관련 콘텐츠를 검색하는 데 사용되며, LLM은 이 프롬프트를 기반으로 답변을 생성합니다.

Question 32

생성형 AI 엔지니어는 레스토랑의 온라인 예약 고객 경험을 개선하기 위해 일반적인 고객 문의를 자동으로 처리하는 LLM 기반 솔루션을 구축하고자 합니다. 이 솔루션의 목표는 개인화된 상호 작용을 유지하면서 사람의 개입이나 전화 통화로 이어지는 상황을 최소화하는 것입니다. 솔루션을 설계하기 위해 생성형 AI 엔지니어는 LLM에 입력할 데이터와 수행해야 할 작업을 정의해야 합니다. 어떤 입력/출력 쌍이 목표 달성에 가장 적합할까요?

1. 입력: 온라인 채팅 기록 / 출력: 예약 세부 정보 선택 항목을 나타내는 버튼

2. 입력: 온라인 채팅 기록 / 출력: 취소 옵션

3. 입력: 고객 리뷰 / 출력: 리뷰 감정 분류

4. 입력: 온라인 채팅 기록 / 출력: 채팅 기록을 사용자별로 그룹화하고, 각 사용자의 상호 작용을 요약합니다.

Question 33

한 팀에서 소프트웨어 개발자를 위한 코드 생성 보조 모델을 만들고자 합니다. 이 모델은 여러 프로그래밍 언어를 지원해야 하며, 품질이 최우선 목표입니다. Databricks Foundation Model API 또는 Marketplace에서 제공되는 모델 중 어떤 것이 가장 적합할까요?

1. Llama2-70B

2. MPT-7B

3. BGE-large

4. CodeLlama-34B

Question 34

생성형 AI 엔지니어는 사용자 지정 MLflow Pyfunc 모델을 활용하여 중간 결과를 반환하는 애플리케이션을 배포해야 합니다. 비밀 키와 자격 증명을 전달하도록 엔드포인트를 어떻게 구성해야 할까요?

1. Databricks Feature Store API를 사용하여 변수를 전달합니다.

2. 비밀 정보를 평문으로 전달하세요

3. spark.conf.set()을 사용하세요.

4. 환경 변수를 사용하여 자격 증명을 추가합니다.

Question 35

생성형 AI 엔지니어가 비정형 문서를 성공적으로 청크 단위로 분할했고, 이 청크들을 벡터 검색 인덱스에 저장하려고 합니다. 현재 데이터프레임은 원본 문서 이름과 텍스트 청크 배열을 저장하는 열로 구성되어 있습니다. 이 데이터프레임을 저장하는 가장 효율적인 방법은 무엇일까요?

1. 먼저 각 문서에 고유 식별자를 생성한 다음 델타 테이블에 저장합니다.

2. 각 청크를 독립적인 JSON 파일로 Unity 카탈로그 볼륨에 저장합니다.

3. 데이터를 훈련 세트와 테스트 세트로 분할하고, 각 문서에 고유 식별자를 생성한 다음, Delta 테이블에 저장합니다.

4. 데이터프레임을 행 단위로 하나의 덩어리로 평탄화하고, 각 행에 고유 식별자를 생성한 다음, Delta 테이블에 저장합니다.

Question 36

다단계 LLM 기반 워크플로우 구축에 가장 적합한 라이브러리는 무엇입니까?

1. LangChain

2. PySpark

3. TensorFlow

4. Pandas

Question 37

생성형 AI 엔지니어가 새로 정의된 프로젝트에 가장 적합한 팀원을 추천하는 생성형 AI 시스템을 구축하고 있습니다. 추천 대상은 프로젝트 일정의 가용성과 프로필이 프로젝트 범위와 얼마나 잘 부합하는지를 고려해야 합니다. 직원 프로필과 프로젝트 범위는 모두 비정형 텍스트 형식으로 저장되어 있습니다. 어떤 시스템 아키텍처를 사용하는 것이 적절할까요?

1. 프로젝트 일정에 따라 참여 가능한 팀원을 찾는 도구를 개발하세요. 팀 프로필을 벡터 저장소에 통합하고, 프로젝트 범위 및 필터링 기능을 활용하여 가장 적합한 팀원을 검색할 수 있도록 하세요.

2. 프로젝트 일정에 따라 참여 가능한 팀원을 찾는 도구를 개발하세요. 모든 프로젝트 범위를 벡터 저장소에 포함시키고, 팀원 프로필을 사용하여 최적의 팀원을 검색하세요.

3. 프로젝트 일정에 따라 참여 가능한 팀원을 찾는 도구를 만드세요. 두 번째 도구는 팀원 프로필과 프로젝트 범위를 조합하여 유사도 점수를 계산합니다. 마지막으로, 팀원들을 순차적으로 검토하고 유사도 점수가 가장 높은 순서대로 팀원을 선택하세요.

4. 프로젝트 일정에 따라 팀원의 가용성을 찾는 도구와, LLM을 사용하여 프로젝트 범위에서 키워드를 추출하는 도구를 개발하세요. 가용성이 있는 팀원들의 프로필을 순회하며 키워드 매칭을 통해 가장 적합한 팀원을 찾아냅니다.

Question 38

생성형 AI 엔지니어가 LLM 기반 번역 애플리케이션이 생성한 번역물의 품질을 평가하고 있습니다. 번역의 정확도를 평가하기 위해 어떤 지표를 사용해야 할까요?

1. Cosine Similarity

2. Perplexity

3. BLEU

4. ROUGE

Question 39

생성형 AI 엔지니어가 사용자가 새로운 스포츠를 배우면서 기술 규정에 대한 질문에 답을 찾을 수 있도록 돕는 RAG 애플리케이션을 설계하고 있습니다. 이 애플리케이션을 구축하고 배포하려면 어떤 단계를 순서대로 따라야 할까요?

1. 소스에서 문서를 수집 → 문서 인덱싱 및 벡터 검색에 저장 → 사용자가 LLM에 쿼리 제출 → LLM이 관련 문서 검색 → 모델 평가 → 응답 생성 → 배포

2. 소스에서 문서를 수집 → 문서 인덱싱 및 벡터 검색 저장 → 사용자 쿼리 → 검색 → 응답 생성 → 모델 평가 → 배포

3. 소스에서 문서 수집 → 인덱싱 → 평가 → 배포

4. 사용자 쿼리 → 데이터 수집 → 인덱싱 → 검색 → 응답 → 평가 → 배포

Question 40

생성형 AI 엔지니어가 아래 코드를 사용하여 LangChain에서 간단한 프롬프트 템플릿을 테스트하는 중 오류가 발생했습니다. 코드는 다음과 같습니다.
from langchain.chains import LLMChain
from langchain_community.llms import OpenAI
from langchain_core.prompts import PromptTemplate
prompt_template = “Tell me a {adjective} joke”
prompt = PromptTemplate(input_variables=[“adjective”], template=prompt_template )
llm = LLMChain(prompt=prompt)
llm.generate([{“adjective”: “funny”}])

API 키가 올바르게 정의되었다고 가정할 때, 생성형 AI 엔지니어는 오류를 수정하기 위해 어떤 부분을 변경해야 할까요?

1. prompt_template = “형용사 농담을 하나 말해 주세요”
prompt = PromptTemplate(input_variables=[“adjective”], template=prompt_template )
llm = LLMChain(llm=OpenAI(), prompt=prompt)
llm.generate([{“adjective”: “funny”}])

2. prompt_template = “{형용사} 농담을 해 주세요”
prompt = PromptTemplate(input_variables=[“형용사”], template=prompt_template )
llm = LLMChain(prompt=prompt)
llm.generate(“재밌는”)

3. prompt_template = “{형용사} 농담을 해 주세요”
prompt = PromptTemplate(input_variables=[“형용사”], template=prompt_template )
llm = LLMChain(prompt=prompt.format(“재밌는”))
llm.generate()

4. prompt_template = “{형용사} 농담을 해 주세요”
prompt = PromptTemplate(input_variables=[“adjective”], template=prompt_template, llm=OpenAI())
llm = LLMChain(prompt=prompt)
llm.generate([{“adjective”: “funny”}])

Question 41

생성형 AI 엔지니어가 시적인 어조(예: 하이쿠)로 기사 요약을 생성하는 시스템을 개발 중입니다. 하지만 생성된 요약이 원하는 어조나 스타일에 맞지 않습니다. 다음 중 어떤 접근 방식이 문제 해결에 도움이 되지 않을까요?

1. 기본 문서의 어조와 스타일을 표준화하거나 중립화하십시오.

2. 원하는 톤과 스타일의 데이터셋을 사용하여 LLM을 미세 조정합니다.

3. LLM에게 원하는 어조 and 스타일로 텍스트 생성하도록 명시적으로 지시하는 프롬프트를 제공하십시오.

4. LLM 지원서 작성 시 몇 회 촬영한 예시를 포함하세요.

Question 42

생성형 AI 엔지니어가 전자상거래 플랫폼을 위한 사기 탐지 시스템을 개발하고 있습니다. 이 시스템은 LLM을 사용하여 텍스트 설명, 고객 이력 및 거래 메타데이터를 기반으로 의심스러운 거래를 표시합니다. 엔지니어는 여러 모델 실험을 추적하고, 성능 지표를 기록하며, 선택된 모델이 프로덕션 환경에 쉽게 배포될 수 있도록 보장하고자 합니다. 어떤 접근 방식을 사용하는 것이 좋을까요?

1. 스프레드시트를 사용하여 실험 결과를 수동으로 기록하고 모델 구성 로그를 유지 관리하십시오.

2. 클라우드 기반 문서 관리 시스템을 사용하여 실험 및 배포 단계를 추적하세요.

3. TensorFlow의 내장 로깅 및 배포 도구를 사용하세요.

4. MLflow를 사용하여 모델 실험을 기록하고, 성능 지표를 추적하고, 프로덕션 환경으로의 배포를 간소화하세요.

5. 실험 로그를 로컬 파일 시스템에 저장하는 사용자 지정 Python 스크립트를 작성하고 Flask를 사용하여 모델을 배포합니다.

Question 43

생성형 AI 엔지니어가 실시간 업데이트 및 분석을 제공하는 LLM 기반 라이브 스포츠 해설 플랫폼을 설계하고 있습니다. 이 플랫폼은 잠재적으로 오래된 기사에 의존하는 대신 실시간 경기 점수를 기반으로 요약을 생성하는 것을 목표로 합니다. 이러한 경기 분석을 생성하는 데 필요한 실시간 데이터에 접근할 수 있도록 해주는 도구는 무엇일까요?

1. 데이터브릭스IQ (DatabricksIQ)

2. 오토ML (AutoML)

3. 파운데이션 모델 API (Foundation Model APIs)

4. 피처 서빙 (Feature Serving)

Question 44

생성형 AI 엔지니어는 LLM과 벡터 스토어를 통합한 고객 지원용 RAG 애플리케이션을 배포하는 임무를 맡았습니다. 이 애플리케이션은 데이터 개인정보보호 규정을 준수해야 합니다. 어떤 규정 준수 조치가 중요한가요? (두 가지를 선택하세요)

복수 선택

1. 초기 배포 시 애플리케이션에 대한 무제한 접근 권한을 허용하십시오.

2. 민감한 정보를 보호하기 위해 저장 중 및 전송 중인 데이터를 암호화합니다.

3. 저장 방식을 간소화하려면 공용 벡터 저장소를 사용하세요.

4. API 키 인증을 사용하여 애플리케이션 접근을 제어하세요.

5. 암호화를 건너뛰고 개인 네트워크 접속을 이용하세요.

Question 45

대규모 컨텍스트 윈도우를 지원하는 LLM은?

1. MPT-30B

2. Llama2-70B

3. DBRX

4. DistilBERT

데이터브릭스 생성형 AI 엔지니어 자격증 기출 문제 덤프 1/6 (45문제)

✅ 관련 글을 읽어보세요

Leave a Comment 응답 취소