데이터브릭스 생성형 AI 엔지니어 자격증 기출 문제 덤프 4/6 (45문제)

Databricks Certified Generative AI Engineer 자격증 합격을 향한 덤프 4번째 세트입니다. 실전 시험에서 마주할 수 있는 핵심 유형을 엄선했습니다.

페이지 내 정답 확인 기능을 통해 이동 중에도 빠르게 복습하며 개념을 완전히 내 것으로 만들어 보세요. 반복 학습이 합격의 지름길입니다.

참고해 주세요! 기출 덤프의 특성상 일부 문제나 선지, 정답에 오류가 있을 수 있습니다. 학습 시 이상한 점이 있다면 교재나 공식 문서를 통해 정답을 다시 한번 확인해 보시는 것을 추천합니다.”

데이터브릭스 생성형 AI 엔지니어 자격증 기출 문제 덤프 4/6 (45문제)

Question 1 복수 선택

생성형 AI 엔지니어는 RAG 애플리케이션 엔드포인트를 배포하기 위한 단계를 순서대로 진행해야 합니다. 올바른 순서는 무엇일까요? (두 가지를 선택하세요)

1. 엔드포인트를 배포하기 전에 문서를 전처리하고 벡터 저장소를 생성하십시오.

2. 임베딩 모델을 학습시키고, 문서를 전처리하고, 벡터 저장소를 생성하고, 엔드포인트를 배포합니다.

3. 사전 처리 단계를 건너뛰고 문서를 엔드포인트에 직접 배포합니다.

4. 엔드포인트를 먼저 배포하고 나중에 임베딩을 구성하십시오.

5. 응답 검색 대신 하드코딩된 응답을 사용하십시오.

6. 입력이나 벡터 검색 없이 LLM만 의존하십시오.

Question 2

생성형 AI 엔지니어가 변호사를 위한 AI 비서를 설계하고 있습니다. 이 비서는 법률 문서를 검색하고 간결한 요약을 생성해야 합니다. 정확한 검색을 보장하기 위한 가장 중요한 고려 사항은 무엇일까요?

1. 법률 데이터 세트를 사용하여 LLM을 세밀하게 조정합니다.

2. 규칙 기반 필터링 시스템을 구축하십시오.

3. 키워드 기반 검색 알고리즘을 사용하세요.

4. 의미 검색을 위한 벡터 데이터베이스를 구현하세요.

Question 3

생성형 AI 엔지니어가 RAG 애플리케이션을 모니터링하기 위해 추론 로깅을 사용하고 있습니다. 추론 로깅은 어떤 통찰력을 제공할 수 있을까요?

1. 언어 출력에 대한 BLEU 점수 및 혼란도.

2. 시간에 따른 모델 학습 손실.

3. 쿼리 패턴, 응답 시간 및 오류 발생 빈도.

4. 토큰 사용량 및 모델 크기.

Question 4

생성형 AI 엔지니어는 지식 베이스의 문서 쿼리를 처리하기 위한 벡터 검색 인덱스를 구축하는 임무를 맡았습니다. 이 인덱스를 생성하고 쿼리하는 데 필요한 단계는 무엇입니까?

1. 쿼리를 인코딩할 때는 임베딩을 사용하되, 문서를 인코딩할 때는 사용하지 마세요.

2. 임베딩 없이 원본 문서에 직접 검색 모델을 사용하십시오.

3. 전처리 과정을 건너뛰고 원시 문서 텍스트를 쿼리를 위해 벡터 저장소에 저장합니다.

4. 문서를 전처리하고, 임베딩 모델을 사용하여 문서를 임베딩하고, 임베딩 결과를 벡터 저장소에 저장하고, 검색기를 사용하여 쿼리를 수행합니다.

Question 5 복수 선택

생성형 AI 엔지니어는 LangChain을 사용하여 제품 사양에 대한 사용자 문의를 처리하는 간단한 체인을 구축해야 합니다. 이 체인은 구조화된 제품 데이터베이스에서 정확한 답변을 반환해야 합니다. 필요한 구성 요소는 무엇입니까? (두 가지 선택하세요)

1. 관련 제품 사양을 가져오는 데이터베이스 검색 도구입니다.

2. 사용자 검색어를 간소화하는 요약 모델.

3. 질의 분석을 위한 사전 학습된 분류 모델.

4. 제품 카테고리를 위한 규칙 기반 필터링 시스템.

5. 사용자 쿼리 형식을 지정하는 구조화된 프롬프트 템플릿입니다.

Question 6

생성형 AI 엔지니어는 MLflow를 사용하여 Unity 카탈로그에 사용자 지정 LLM을 등록해야 합니다. 이 과정의 주요 단계는 무엇입니까?

1. MLflow에 모델을 기록하고, 메타데이터(예: 스키마 및 설명)를 구성한 다음, 관리 및 검색을 위해 Unity 카탈로그에 등록합니다.

2. MLflow에 로그를 남기지 않고 Unity 카탈로그에 모델을 직접 등록합니다.

3. 모델을 등록하지 않고 MLflow 추적 서버만 사용합니다.

4. 회원가입 시 메타데이터 구성을 건너뜁니다.

Question 7

생성형 AI 엔지니어가 고객 지원 챗봇의 다중 턴 대화 파이프라인을 설계하고 있습니다. 챗봇이 이전 대화 내용을 자주 잊어버리는 문제가 있는데, 어떤 기능을 구현해야 할까요?

1. 토큰 제한을 늘리세요.

2. 이전 대화 내용의 맥락을 유지하기 위해 상태 추적 기능을 사용합니다.

3. 매 턴이 끝날 때마다 컨텍스트를 초기화합니다.

4. 더 낮은 온도로 설정하세요.

Question 8

생성형 AI 엔지니어는 법률 자문을 생성하는 챗봇의 출력물을 평가해야 합니다. 출력물에는 종종 모호한 내용이 포함됩니다. 이러한 문제를 식별하고 해결하기 위해 어떤 방법을 사용해야 할까요?

1. 더 방대한 데이터셋으로 챗봇을 학습시키세요.

2. 답변을 간결하게 하려면 요약 모델을 사용하세요.

3. 챗봇 응답에 대한 BLEU 점수를 측정합니다.

4. 응답의 명확성과 정확성을 정성적으로 평가한 후, 모호성을 줄이기 위해 질문을 다듬으세요.

Question 9

생성형 AI 엔지니어는 챗봇 쿼리에서 고객 의도를 식별하고 추출하는 파이프라인을 개발해야 합니다. 어떤 임베딩 모델을 선택해야 할까요?

1. 문장 변환기 (Sentence Transformers)

2. GloVe

3. 분류를 위한 BERT 기반

4. Word2Vec

Question 10

생성형 AI 엔지니어가 역사적 사건에 대한 질문에 답하는 QA 시스템의 프롬프트를 설계하고 있습니다. 답변에는 날짜, 주요 인물 및 결과가 포함되어야 합니다. 프롬프트는 어떤 구조로 구성되어야 할까요?

1. 이 역사적 사건의 원인을 설명하십시오.

2. 날짜, 주요 수치 및 결과에 대한 자세한 내용을 포함하여 질문에 답하십시오.

3. 역사적 사건에 대한 개괄적인 설명을 제공하십시오.

4. 해당 역사적 사건에 대한 요약을 제공하십시오.

Question 11

한 전자 회사의 생성형 AI 엔지니어가 고객이 제품에 대해 질문할 수 있는 RAG 애플리케이션을 배포했습니다. 그러나 RAG 응답이 관련 없는 제품에 대한 정보를 자주 제공한다는 피드백을 받았습니다. 엔지니어는 RAG 응답의 관련성을 높이기 위해 무엇을 할 수 있을까요?

1. 생성된 응답을 개선하려면 다른 LLM을 사용하십시오.

2. 다른 의미 유사성 검색 알고리즘을 사용하십시오.

3. 검색된 문맥의 품질을 평가합니다.

4. 자주 묻는 질문에 대한 캐싱을 구현하세요.

Question 12 복수 선택

생성형 AI 엔지니어는 의료기관을 위한 검색 증강 생성(RAG) 시스템을 구축하는 임무를 맡았습니다. 이 시스템은 환자 관련 문서를 검색하고 주요 결과를 안전하게 요약해야 합니다. 이 파이프라인을 구축하는 데 필요한 핵심 구성 요소는 무엇입니까? (네 가지 선택하세요)

1. 의료 데이터세트로 학습된 임베딩 모델.

2. 임상 보고서에 최적된 요약 모델입니다.

3. 질병 상태를 분류하는 모델.

4. 실시간 처리를 위한 저지연 GPU 인프라.

5. 접근 제어 기능을 갖춘 안전한 문서 검색 도구.

Question 13

LLM 응답에서 환각 현상을 줄이기 위해, 검색 증강 생성(RAG) 파이프라인을 구현할 때 가장 효과적인 접근 방식은 무엇입니까?

1. 추론 과정에서 온도 매개변수를 높이십시오.

2. 모델에 정확한 맥락을 제공하기 위해 고품질 문서 검색 시스템을 사용하십시오.

3. 더 큰 데이터셋으로 모델을 학습시키세요.

4. 모델 응답의 길이를 줄이세요.

Question 14

생성형 AI 엔지니어가 의료 챗봇 개발을 위해 1차 및 2차 의료 문서가 포함된 데이터셋을 다루고 있습니다. 사실 정확성을 보장하기 위해 어떤 유형의 문서를 우선적으로 고려해야 할까요?

1. 건강 관련 소셜 미디어 게시물.

2. 의학 교과서 요약.

3. 동료 평가를 거친 의학 연구 논문 및 정부 보건 지침.

4. 환자 블로그 및 포럼 게시글.

Question 15

생성형 AI 엔지니어가 의료 애플리케이션용 챗봇을 배포하고 있습니다. 엔지니어는 챗봇이 출력물에 환자의 개인 정보를 생성하지 않도록 어떻게 보장할 수 있을까요?

1. 자세한 답변이 나오는 것을 방지하기 위해 챗봇의 응답 길이를 제한하세요.

2. 익명화된 데이터셋만을 사용하여 챗봇을 학습시키세요.

3. 입력 필터링 및 응답 유효성 검사를 사용하여 처리 및 출력 생성 중에 개인 정보가 차단되도록 하십시오.

4. 챗봇 응답을 사용자에게 반환하기 전에 모두 암호화하시오.

Question 16

생성형 AI 엔지니어는 지원 챗봇을 위해 포럼 게시글 데이터셋을 전처리해야 합니다. 많은 게시글에는 하이퍼링크와 삽입된 미디어가 포함되어 있습니다. 엔지니어는 어떤 전처리 단계를 거쳐야 할까요?

1. 추가적인 맥락을 유지하기 위해 하이퍼링크를 그대로 둡니다.

2. 하이퍼링크나 미디어를 삭제하지 않고 게시글 내용을 요약합니다.

3. 하이퍼링크와 삽입된 미디어를 제거하고 텍스트 콘텐츠만 남깁니다.

4. 하이퍼링크나 미디어가 포함된 게시물을 완전히 제외합니다.

Question 17 복수 선택

생성형 AI 엔지니어는 제품 카탈로그가 포함된 HTML 파일에서 텍스트를 추출하는 작업을 맡았습니다. 이 작업에 가장 적합한 Python 패키지는 무엇입니까? (두 가지 선택하세요)

1. HTML 콘텐츠를 파싱하고 텍스트를 추출하는 BeautifulSoup입니다.

2. 텍스트 추출을 위한 pdfplumber.

3. OCR 작업을 위한 pytesseract.

4. 대용량 HTML 파일을 더 빠르고 효율적으로 파싱하기 위한 LXML입니다.

5. PyPDF2는 PDF에서 텍스트를 추출하는 도구입니다.

Question 18

LLM이 생성한 요약의 정확도를 평가하는 데 가장 적합한 지표는 무엇입니까?

1. Perplexity

2. F1 score

3. ROUGE score

4. BLEU score

Question 19

생성형 AI 엔지니어는 표, 이미지, 텍스트가 포함된 PDF 파일에서 고객 피드백을 추출해야 합니다. 이 작업에 가장 적합한 도구는 무엇일까요?

1. PDF 콘텐츠 파싱을 위한 BeautifulSoup.

2. PyPDF2는 PDF 콘텐츠를 읽고 추출하는 데 사용됩니다.

3. PDFplumber는 PDF에서 구조화된 텍스트와 표를 추출하는 데 사용됩니다.

4. OCR 추출을 위한 pytesseract.

Question 20

생성형 AI 엔지니어는 고객 지원 챗봇의 문서 검색 기능을 최적화하고 있습니다. 사용자 피드백에 따르면 관련 없는 결과가 자주 나타납니다. 엔지니어는 어떤 부분을 개선하는 데 집중해야 할까요?

1. 응답 생성의 다양성

2. 문서 길이 필터링

3. 정밀도 (Precision)

4. 재현율 (Recall)

Question 21 복수 선택

생성형 AI 엔지니어는 금융 뉴스 기사를 요약하는 LLM을 평가해야 합니다. 이 시스템은 정확하고 간결하며 시의적절한 요약을 생성해야 합니다. 모델 평가 및 배포를 안내하는 데 사용해야 할 지표는 무엇입니까? (네 가지 선택)

1. 쿼리당 토큰 사용량을 추적하여 계산 비용을 관리합니다.

2. 생성된 요약문에서 단어 순서를 비교하기 위해 BLEU를 사용합니다.

3. ROUGE는 콘텐츠 관련성 및 참조 자료 요약과의 중복성을 평가하는 데 사용됩니다.

4. 요약의 유창성을 평가하기 위한 지표

5. 시스템이 요약 정보를 신속하게 제공할 수 있도록 지연 시간을 설정합니다.

Question 22

생성형 AI 엔지니어는 고객의 제품 관련 질문에 답변하는 챗봇용 안내 메시지를 제작해야 합니다. 챗봇은 창의성보다는 사실적 정확성을 우선시해야 합니다. 안내 메시지에는 어떤 내용이 포함되어야 할까요?

1. 별도의 지침 없이 모델의 기본 동작에 의존합니다.

2. “”창의적인 답변을 작성해 주세요.””라는 지침입니다.

3. “”질문에 답변하세요.””와 같은 일반적인 지침.

4. “”고객 질문에 간결하고 사실에 입각한 답변을 제공하십시오.””와 같은 명확한 지침.

Question 23

생성형 AI 엔지니어가 제품 반품 요청을 처리하는 고객 서비스 챗봇을 설계하고 있습니다. 이 챗봇은 정확하고 정중한 답변을 제공해야 합니다. 이를 구현하기 위해 어떤 접근 방식을 사용해야 할까요?

1. 사용자 입력을 처리하기 위해 요약 기법을 활용하세요.

2. 시스템에 예외별 규칙을 사후 처리 필터로 추가하세요.

3. 정중한 어조 데이터 세트와 반품 정책 정보를 기반으로 LLM을 세밀하게 조정합니다.

4. 응답 처리를 위해 일반적인 사전 학습된 모델을 사용하십시오.

Question 24

생성형 AI 엔지니어는 재무 보고서를 검색하고 주요 성과 지표를 요약하는 파이프라인을 구축해야 합니다. 이 시스템은 수천 건의 보고서를 효율적으로 처리해야 합니다. 이러한 파이프라인을 설계하는 올바른 순서는 무엇일까요?

1. 1. 리트리버 배포 → 2. 원시 보고서를 데이터베이스에 저장 → 3. 검색된 보고서 요약 → 4. 데이터베이스 인덱싱

2. 1. 요약 모델 미세 조정 → 2. 임베딩 생성 → 3. 검색기 구축 → 4. 운영 환경에 배포

3. 1. 모든 보고서 전처리 → 2. 검색 도구 배포 → 3. 언어 모델 미세 조정 → 4. 출력 요약

4. 1. 모든 재무 보고서에 대한 임베딩 생성 → 2. 벡터 검색 인덱스에 임베딩 저장 → 3. 검색기 구축 → 4. 검색 결과에 대한 요약 모델 배포

Question 25

생성형 AI 엔지니어는 텍스트 기반 사용자 리뷰를 제품 품질, 배송, 고객 서비스와 같은 범주별 인사이트로 변환하는 파이프라인에 필요한 도구를 선정하는 임무를 맡았습니다. 어떤 구성 요소가 중요할까요?

1. 리뷰를 의미론적으로 표현하는 임베딩 모델.

2. 유사한 리뷰를 검색하는 시스템.

3. 사용자 리뷰를 요약하는 모델.

4. 미리 정의된 범주를 기반으로 사용자 리뷰를 분류하는 분류 모델.

Question 26

생성형 AI 엔지니어는 지식 관리 시스템을 위한 벡터 검색 인덱스를 생성하고 쿼리해야 합니다. 정확한 결과를 보장하기 위해 필수적인 단계는 무엇일까요?

1. 내장된 이미지 없이 원본 문서를 그대로 저장하십시오.

2. 문서 전처리 과정을 건너뛰고 임베딩을 바로 생성합니다.

3. 문서를 전처리하고, 텍스트에 대한 임베딩을 생성하고, 임베딩을 벡터 저장소에 저장하고, 쿼리에 대해 최근접 이웃 검색을 사용합니다.

4. 쿼리에는 키워드 기반 일치만 사용하십시오.

Question 27 복수 선택

생성형 AI 엔지니어는 생성형 애플리케이션에 사용되는 의료 기록 데이터 세트의 라이선스 요구 사항을 검토하는 임무를 맡았습니다. 법적 준수를 보장하기 위해 어떤 조치를 취해야 할까요? (두 가지를 선택하세요)

1. 데이터 세트가 HIPAA 또는 관련 데이터 개인정보 보호 규정을 준수하는지 확인하십시오.

2. 비상업적 용도의 경우 라이선스 확인이 필요하지 않다고 가정합니다.

3. 데이터셋을 상업적 목적으로 사용할 수 있는지 여부를 확인하려면 라이선스 조건을 확인하십시오.

4. LLM의 결과물에 데이터 출처에 대한 고지 사항이 포함되도록 하십시오.

5. 데이터셋이 공개적으로 이용 가능한 동안에는 자유롭게 사용하십시오.

Question 28

생성형 AI 엔지니어가 여행사를 위한 챗봇을 개발하고 있습니다. 이 챗봇은 사용자의 날씨 선호도, 예산, 활동을 바탕으로 여행지를 추천해야 합니다. 파이프라인 설계의 첫 번째 단계는 무엇일까요?

1. 여행 데이터 교육을 받은 LLM을 선택하여 추천을 받으세요.

2. 예산, 선호 날씨, 활동과 같은 입력 필드와 목적지, 활동 추천과 같은 출력 필드를 정의하세요. 예시: 입력: { “budget”: “$3000”, “preferred_weather”: “tropical”, “activities”: “adventure” } → 출력: { “destination”: “Thailand”, “activity_recommendations”: “snorkeling, jungle trekking” }.

3. 여행지와 활동에 대한 데이터베이스를 만드세요.

4. 초기 권장 사항에 대한 피드백을 수집하세요.

Question 29

생성형 AI 엔지니어는 방대한 교육 자료 모음에서 객관식 문제를 생성해야 합니다. 이 문제들은 개념 이해도와 지식 적용 능력을 평가해야 합니다. 어떤 접근 방식을 취해야 할까요?

1. 요약 모델을 사용하여 자료를 핵심 요점으로 압축하세요.

2. 교육 데이터 세트를 사용하여 LLM을 세밀하게 조정합니다.

3. 주어진 자료로부터 답을 도출하는 분류 모델을 학습시키세요.

4. 질문 구조, 선택지 및 정답을 명시한 프롬프트 템플릿을 사용하십시오.

Question 30

증가하는 쿼리 볼륨을 처리하는 데 있어 프로덕션 LLM 애플리케이션의 확장성을 평가해야 합니다. 어떤 지표가 가장 중요할까요?

1. BLEU와 perplexity

2. 토큰 사용량 및 쿼리당 비용

3. 모델 크기 및 매개변수 개수

4. 다양한 작업 부하 조건에서의 처리량 및 지연 시간

Question 31

생성형 AI 엔지니어가 RAG 시스템의 검색 성능을 평가하고 있습니다. 이 평가에 가장 적합한 지표는 무엇일까요?

1. 검색 성능 평가를 위한 BLEU 점수.

2. 응답 시간을 측정하는 데 사용되는 지연 시간.

3. 검색 결과의 관련성과 적용 범위를 측정하기 위한 정밀도와 재현율.

4. 응답 유창성을 측정하기 위한 당혹도.

Question 32

생성형 AI 엔지니어는 LLM이 재무 보고서를 요약할 때 일관된 답변을 하도록 유도하는 프롬프트를 만들어야 합니다. 가장 효과적인 프롬프트 전략은 무엇일까요?

1. 모델이 별도의 지침 없이 작업을 해석하도록 허용합니다.

2. “보고서 내용을 요약해 주세요.”와 같이 짧고 모호한 질문을 사용하세요.

3. “주요 재무 수치와 추세를 명확하고 간결하게 요약하시오.”와 같이 명확한 지침과 예시를 제시하십시오.

4. 서로 모순되는 지시사항을 담은 여러 개의 프롬프트를 사용하세요.

Question 33

LLM 애플리케이션을 개발할 때 법적 위험을 피하기 위해서는 모델 학습에 사용되는 데이터가 라이선스 요구사항을 준수하는지 확인하는 것이 매우 중요합니다. 다음 중 법적 위험을 피하기 위해 적절하지 않은 행동은 무엇입니까?

1. 본인이 직접 제작하고 완전히 독창적인 모든 데이터를 사용할 수 있으며, 사용 라이선스도 직접 결정할 수 있습니다.

2. 학습된 모델 사용을 시작한 후에는 데이터 관리자에게 직접 연락하여 알려주세요.

3. 학습된 모델을 사용하기 전에 데이터 관리자에게 직접 연락하여 알려주십시오.

4. 명시적으로 오픈 라이선스가 표시된 데이터만 사용하고 라이선스 약관을 준수하십시오.

Question 34

생성형 AI 엔지니어가 이력서와 직무 설명을 기반으로 구직자를 추천하는 시스템에 사용할 임베딩 모델을 평가하고 있습니다. 이 모델은 512토큰 길이의 컨텍스트를 가지고 있습니다. 더 긴 이력서를 처리하도록 시스템을 어떻게 수정해야 할까요?

1. 요약 모델을 활용하여 이력서 길이를 줄이세요.

2. 청크는 512토큰 제한 내에서 더 작은 섹션으로 분할되어 각 청크를 독립적으로 처리합니다.

3. 더 긴 컨텍스트 길이를 사용하여 새로운 임베딩 모델을 학습시킵니다.

4. 너무 긴 이력서는 무시하고 토큰 제한 내에 있는 이력서만 처리합니다.

Question 35

생성형 AI 엔지니어가 문서를 검색하고 요약을 생성하는 RAG 애플리케이션의性能을 평가하고 있습니다. 검색 단계에서 재현율은 높지만 정밀도가 낮습니다. 이는 무엇을 의미하며, 어떻게 해결해야 할까요?

1. 이 시스템은 지연 시간이 짧아 검색 정확도가 떨어집니다.

2. 요약 단계에서 불완전한 요약이 생성되고 있습니다.

3. 이 시스템은 관련 문서는 모두 검색하지만 다른 문서는 제외하므로 더 큰 배치 크기가 필요합니다.

4. 이 시스템은 관련성 있는 문서를 많이 검색하지만 관련 없는 문서도 포함하므로 더 나은 필터링 또는 포함 기능이 필요합니다.

Question 36

생성형 AI 엔지니어는 소프트웨어 설치 지침을 제공하는 챗봇용 안내 메시지를 설계해야 합니다. 응답에는 단계별 지침과 일반적인 문제에 대한 경고가 포함되어야 합니다. 안내 메시지에는 무엇이 포함되어야 할까요?

1. 자세한 설치 지침과 함께 일반적인 경고 사항 및 문제 해결 팁을 제공합니다.

2. 설치 과정의 주요 단계만 포함하세요.

3. 소프트웨어 설치 과정을 요약하십시오.

4. 소프트웨어 기능에 대해 간결하게 설명하십시오.

Question 37

생성형 AI 엔지니어는 사용자 피드백 데이터를 덩어리로 나누어 Delta Lake 테이블에 저장하는 작업을 맡았습니다. 최적의 데이터 준비 및 저장 순서를 보장하는 작업 순서는 무엇일까요?

1. 피드백 데이터에 대한 스키마를 정의하고 → 텍스트를 청크로 분할한 다음 → 분할된 텍스트를 Delta Lake 테이블에 저장합니다.

2. 모든 피드백 데이터를 하나의 큰 덩어리로 Delta Lake에 기록합니다.

3. 데이터 분할을 건너뛰고 피드백을 Delta Lake에 직접 기록합니다.

4. 먼저 텍스트를 청크로 나누고 → 청크를 Delta Lake에 기록한 다음 → 나중에 스키마를 정의합니다.

Question 38

생성형 AI 엔지니어가 MLflow를 사용하여 LLM을 Unity 카탈로그에 등록하는 작업을 맡았습니다. 등록 과정에서 어떤 정보를 설정해야 함니까?

1. 메타데이터 구성을 건너뜁고 기본 설정으로 모델을 등록하십시오.

2. 스키마나 태그 없이 모델 이름과 버전만 표시됩니다.

3. Unity 카탈로그에 모델을 등록하지 않고 MLflow만 사용하십시오.

4. 추적 및 관리를 위해 이름, 버전, 스키마 및 태그와 같은 모델 메타데이터를 저장합니다.

Question 39

생성형 AI 엔지니어가 LLM을 사용하여 사용자 쿼리에 불완전한 응답을 제공하는 시스템을 디버깅하고 있습니다. 가장 가능성이 높은 원인은 무엇입니까?

1. 사용자 검색어가 너무 짧습니다.

2. 해당 모델은 작업에 비해 너무 큽니다.

3. 온도 설정이 너무 높습니다.

4. 제시된 지침이나 맥락이 명확하지 않습니다.

Question 40 복수 선택

생성형 AI 엔지니어가 대규모 재무 보고서 데이터 세트를 조회하는 LangChain 기반 RAG 애플리케이션을 코딩하는 임무를 맡았습니다. 데이터 세트에는 정형 데이터와 비정형 데이터가 모두 포함되어 있습니다. 이 RAG 체인에는 어떤 구성 요소가 포함되어야 할까요? (두 가지를 선택하세요)

1. 검색 결과를 요약하는 모델.

2. 금융 관련 문의를 분류하는 모델.

3. 정형 데이터와 비정형 데이터를 모두 처리할 수 있는 임베딩 모델.

4. 사전 학습된 감정 분석 모델.

5. 벡터 저장소에서 관련 데이터를 가져오는 리트리버입니다.

Question 41

생성형 AI 엔지니어는 학생들을 위한 교육 콘텐츠 요약을 생성하는 시스템을 구축해야 합니다. 요약에는 핵심 개념, 예시, 실제 적용 사례의 세 가지 내용이 포함되어야 합니다. 최적의 파이프라인 설계는 무엇일까요?

1. 내용을 더 짧은 텍스트로 압축하려면 요약 모델을 사용하세요.

2. LLM을 사용하여 핵심 개념, 예시 및 응용 프로그램을 중심으로 구성된 요약을 동적으로 생성하세요.

3. 규칙 기반 시스템을 사용하여 미리 정의된 교육 요소를 추출합니다.

4. 임베딩 모델을 사용하여 교육 텍스트를 의미론적으로 표현합니다.

Question 42

생성형 AI 엔지니어가 안전한 의료 챗봇 응답을 생성하기 위한 모델을 선택하고 있습니다. 데이터 개인정보 보호를 보장하는 데 가장 중요한 기능은 무엇일까요?

1. 해당 모델은 응답의 다양성을 우선시해야 합니다.

2. 해당 모델은 사용자 입력을 저장하거나 외부 데이터 저장소를 기반으로 응답을 생성해서는 안 됩니다.

3. 모델은 항상 정확도보다 속도를 우선시해야 합니다.

4. 해당 모델은 외부 API 호출을 무제한으로 허용해야 합니다.

Question 43

생성형 AI 엔지니어가 사용자가 제공한 콘텐츠를 처리하는 생성형 애플리케이션을 개발하고 있습니다. 이 애플리케이션은 인젝션 공격과 같은 악의적인 사용자 입력으로부터 보호되어야 합니다. 어떤 안전장치 기술을 사용해야 할까요?

1. 유연성을 높이기 위해 사용자 입력에 제한을 두지 마십시오.

2. 요약 모델을 사용하여 사용자 입력을 전처리합니다.

3. 특수 문자를 제거하고 데이터 형식을 검증하여 사용자 입력값을 정제합니다.

4. 사용자 입력을 기록하고 모니터링하여 의심스러운 패턴을 찾아냅니다.

Question 44

생성형 AI 엔지니어가 전자상거래 플랫폼용 고객 지원 챗봇을 개발하고 있습니다. 이 챗봇은 일반적인 질문에 대한 답변을 제공하고, 해결되지 않은 문제는 상담원에게 전달해야 합니다. 엔지니어는 설계 시 무엇을 우선시해야 할까요?

1. 사용자 쿼리를 의미론적으로 이해하기 위해 임베딩 모델에 집중하세요.

2. 대규모 과거 대화 데이터셋을 사용하여 챗봇을 학습시키세요.

3. 해결되지 않은 문의 사항을 상담원에게 전달하는 대체 메커니즘을 구현하십시오.

4. 미리 정의된 쿼리 처리에 규칙 기반 논리를 사용하십시오.

Question 45

생성형 AI 엔지니어는 배포를 위해 머신러닝 모델을 Unity 카탈로그에 등록해야 합니다. 이렇게 하면 어떤 이점이 있을까요?

1. 사용자 지정 작업을 위한 세밀 조정 기능.

2. 자동화된 하이퍼파라미터 튜닝.

3. 모델 추론 시간 단축.

4. 중앙 집중식 모델 관리, 버전 관리 및 접근 제어.

데이터브릭스 AI 엔지니어 자격증 합격 팁

표시된 정답은 학습 참고용이므로 공식 가이드를 함께 교차 검증하시는 것을 추천합니다. 다음 단계인 [데이터브릭스 생성형 AI 엔지니어 덤프 5/6] 포스팅에서 다음 문제를 이어 푸실 수 있습니다.

데이터브릭스 생성형 AI 엔지니어 자격증 기출 문제 덤프 4/6 (45문제)

데이터브릭스 AI 엔지니어 자격증 합격 팁

✅ 관련 글을 읽어보세요

Leave a Comment 응답 취소