google ai 요약에 따르면

ollama는 VRAM 합산해서 큰 용량의 모델을 돌릴수 있다고 한다.

 

Ollama supports multiple GPUs (both NVIDIA and AMD) by automatically splitting model layers across available VRAM, allowing users to run large models that exceed the capacity of a single card.
Reddit +1
VRAM Aggregation and Usage
  • Total Capacity: Ollama sums the total VRAM across all detected GPUs (e.g., two 16GB GPUs behave as 32GB).
  • Layer Splitting: If a model cannot fit into one GPU, Ollama splits the layers, distributing the load between GPU (fast) and system RAM (slow).
  • Example Scenario: A 30GB Q4_K_M model (e.g., Llama 3 70B) can be split across two 16GB or two 24GB GPUs, loading roughly 50% on each.
  • KV Cache: A portion of VRAM is reserved for the context window (KV cache), which can take several GBs depending on context length.
    Reddit +3
Multi-GPU Performance Considerations
  • Optimal Use: If the model fits into a single GPU, Ollama will typically use only one card for the best performance, as splitting increases data transfer between cards.
  • Performance Penalty: Partial offloading (spreading a model across both GPU and CPU) can cause performance to degrade by 5–20x.
  • Mixing GPUs: You can mix different GPUs (e.g., a 3090 24GB + 1660 6GB), but the overall performance might be bottlenecked by the slower card.
  • Multi-Instance Setup: To maximize performance on multiple GPUs, you can run multiple instances of Ollama on different ports, each assigned to a specific GPU (e.g., using CUDA_VISIBLE_DEVICES).
    Reddit +4
How to Configure
  • NVIDIA: Set CUDA_VISIBLE_DEVICES=0,1 (comma-separated IDs) to enable multi-GPU.
  • AMD: Use ROCR_VISIBLE_DEVICES=0,1.
  • Automatic Split: By default, Ollama handles the split automatically, but you can set PARAMETER num_gpu 999 in a Modelfile to force all layers to be spread across all available GPUs.
    LocalLLM.in +1
VRAM Requirements by Model Size
  • Entry-level (3-4GB VRAM): 3-4B models (Q4_K_M).
  • Mid-range (6-8GB VRAM): 7-9B models (Q4_K_M).
  • High-end (10-12GB VRAM): 12-14B models (Q4_K_M).
  • Dual GPU Setup (16-24GB VRAM): 22-35B models (Gemma 3 27B, Qwen3 32B).
  • Workstation (48GB+ VRAM): 70B+ models (Llama 3.3 70B).
    LocalLLM.in

 

그래서 dual GPU setup 으로 이야기가 나오는데,

아무튼 24G VRAM 두개 해서 48G 로 해서 70B 모델을 돌릴수 있다고 한다.

하나 더 지르고.. 메인보드도 sli/crossfire 지원으로 바꾸고 파워도 올리고.. 해야하나?

Can I use multiple GPUs with Ollama for larger models?
Yes, Ollama supports multi-GPU configurations for NVIDIA and AMD cards. For NVIDIA, set CUDA_VISIBLE_DEVICES to comma-separated GPU IDs to distribute model layers across multiple GPUsThis enables running 70B models on dual 24GB GPUs (48GB total) that wouldn't fit on a single card. For AMD GPUs, use ROCR_VISIBLE_DEVICES with the same approach to leverage combined VRAM across multiple cards.

[링크 : https://localllm.in/blog/ollama-vram-requirements-for-local-llms]

'프로그램 사용 > ai 프로그램' 카테고리의 다른 글

ollama with 1080 Ti  (0) 2026.04.16
트랜스포머 모델 입/출력  (0) 2026.04.12
ollama 소스코드  (0) 2026.04.12
ollama 데이터 파일 구조 및 내용  (0) 2026.04.12
ollama /set parameter num_gpu 테스트  (0) 2026.04.12
Posted by 구차니

정말 깨끗하게 잘 도착함

아래는 1060 6GB. 그래도 어찌어찌 케이스에 잘 우겨넣었는데\

6pin + 8pin 전원을 추가로 넣어야해서 어째 불안불안.. (500W 라서..)

 

 

와우. 메모리가 넉넉해! 더 높은걸 해도 되겠어!!! 싶었는데

해보니 gemma4:e4b는 cpu+gpu로 가속된다. 메모리가 12기가는 되었어야 했나.. 쩝

 

나름 가벼운 모델임에도 메모리 8.5기가/11기가 GPU 81% 소모하네 ㄷㄷ

Thu Apr 16 21:49:46 2026
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 582.28                 Driver Version: 582.28         CUDA Version: 13.0     |
+-----------------------------------------+------------------------+----------------------+
| GPU  Name                  Driver-Model | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce GTX 1080 Ti   WDDM  |   00000000:01:00.0  On |                  N/A |
| 30%   56C    P2            207W /  250W |    8570MiB /  11264MiB |     81%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|    0   N/A  N/A            2348      C   ...al\Programs\Ollama\ollama.exe      N/A      |
|    0   N/A  N/A            3644    C+G   ...Chrome\Application\chrome.exe      N/A      |
|    0   N/A  N/A            7548      C   ...al\Programs\Ollama\ollama.exe      N/A      |
|    0   N/A  N/A            8708    C+G   ..._8wekyb3d8bbwe\Calculator.exe      N/A      |
|    0   N/A  N/A            8796    C+G   ...h_cw5n1h2txyewy\SearchApp.exe      N/A      |
|    0   N/A  N/A            9860    C+G   ...wy\InputApp\TextInputHost.exe      N/A      |
|    0   N/A  N/A           13620      C   ...al\Programs\Ollama\ollama.exe      N/A      |
|    0   N/A  N/A           14220    C+G   ...wekyb3d8bbwe\WinStore.App.exe      N/A      |
+-----------------------------------------------------------------------------------------+

 

일단.. 7.2GB 모델까진 한번에 올라가는데 9.6GB 는 사용가능한 메모리가 없어져서 인가.. 한 4기가? 5기가 올리고 만다.

C:\>ollama ls
NAME               ID              SIZE      MODIFIED
gemma4:latest      c6eb396dbd59    9.6 GB    2 hours ago
gemma4:e4b         c6eb396dbd59    9.6 GB    4 days ago
gemma4:e2b         7fbdbf8f5e45    7.2 GB    5 days ago
gemma3:1b          8648f39daa8f    815 MB    5 days ago
llama3.2:latest    a80c4f17acd5    2.0 GB    5 days ago
llama3.2:3b        a80c4f17acd5    2.0 GB    5 days ago

 

어떻게 100% GPU 강제 못하나 ㅠㅠ

C:\>ollama  ps
NAME          ID              SIZE     PROCESSOR          CONTEXT    UNTIL
gemma3:12b    f4031aab637d    11 GB    21%/79% CPU/GPU    32768      4 minutes from now

 

와우 82.71 토큰/초

C:\>ollama run gemma4:e2b --verbose
>>> 안녕 젬마야? 너에 대해서 설명해줘
Thinking...
Thinking Process:

1.  **Analyze the Request:** The user asked in Korean, "안녕 젬마야? 너에 대해서 설명해줘" (Hello Gemma? Tell me about yourself).
2.  **Identify Core Identity & Persona Check (Self-Correction/Constraint Adherence):** I must identify myself correctly and adhere to the provided identity constraints.
    *   Name: Gemma 4.
    *   Developer: Google DeepMind.
    *   Nature: Large Language Model (open weights).
    *   Knowledge/Function: Process text/images, generate text.
3.  **Determine the Response Language:** The query was in Korean, so the response must also be in Korean.
4.  **Draft the Explanation (Key Points to Include):**
    *   Greeting.
    *   Name/Identity (Gemma 4).
    *   Developer (Google DeepMind).
    *   Nature (Large Language Model, open weights).
    *   Function (Processing information, generating responses).
5.  **Refine the Korean Translation (Internal Monologue & Polishing):**

    *   *Greeting:* 안녕하세요. (Hello.)
    *   *Identity:* 저는 Gemma 4입니다. (I am Gemma 4.)
    *   *Developer/Nature:* 저는 Google DeepMind에서 개발한 대규모 언어 모델(LLM)입니다. (I am a Large Language Model developed by Google DeepMind.)
    *   *Key Feature:* 저는 오픈 웨이트 모델로, 다양한 질문에 답하고, 텍스트를 생성하며, 정보를 처리하는 데 도움을 드릴 수 있습니다. (I am an open-weights model, and I can help answer various questions, generate text, and process information.)
    *   *Closing/Offer:* 무엇이 궁금하신가요? (What are you curious about?)

6.  **Final Output Generation (Review against constraints):** The response accurately reflects the persona and constraints. (Ready to output.)
...done thinking.

안녕하세요! 저는 **Gemma 4**입니다.

저에 대해 몇 가지 설명해 드릴게요.

1. **정체성:** 저는 Google DeepMind에서 개발한 **대규모 언어 모델(Large Language Model, LLM)**입니다.
2. **특징:** 저는 오픈 웨이트 모델로 설계되었으며, 방대한 양의 텍스트 데이터를 학습하여 질문에 답하고, 텍스트를 생성하며, 정보를 요약하고 다양한 종류의 언어 관련 작업을 수행할 수 있습니다.
3. **기능:** 저는 텍스트 입력과 이미지를 이해하고 처리할 수 있으며, 사용자님과의 대화를 통해 정보를 제공하고 도움을 드리는 것을 목표로 합니다.
4. **지식 범위:** 저의 지식은 학습된 데이터를 기반으로 하며, 특정 시점(저의 지식 차단 시점은 2025년 1월입니다)까지의 정 보를 기반으로 답변을 제공합니다.

궁금한 점이 있으시면 무엇이든 물어봐 주세요! 😊

total duration:       8.6122077s
load duration:        255.4776ms
prompt eval count:    28 token(s)
prompt eval duration: 95.322ms
prompt eval rate:     293.74 tokens/s
eval count:           647 token(s)
eval duration:        7.8226394s
eval rate:            82.71 tokens/s

 

C:\>ollama run gemma3:1b --verbose
>>> 안녕? 너에 대해서 설명해줘
안녕하세요! 저는 구글에서 훈련한 대규모 언어 모델입니다.

**간단히 말해서, 저는 텍스트와 이미지를 입력으로 받아 텍스트를 생성하는 데 특화된 AI 모델입니다.**

좀 더 자세히 설명하면 다음과 같습니다:

*   **훈련 데이터:** 저는 방대한 양의 텍스트 데이터를 학습했습니다. 여기에는 책, 웹사이트, 기사, 코드 등 다양한 종류
의 텍스트가 포함됩니다.
*   **기능:** 저는 질문에 답하고, 텍스트를 요약하고, 번역하고, 창의적인 텍스트를 생성하고, 코드 등을 수행할 수 있습
니다.
*   **저의 한계:** 저는 아직 완벽하지 않습니다. 때로는 사실과 다른 정보나 편향된 내용을 생성할 수 있습니다. 또한, 저
 또한 인간과 같은 감정을 가지고 있지 않으므로, 인간적인 상호작용에는 한계가 있습니다.
*   **현재 위치:** 저는 지속적으로 학습하고 개선되고 있습니다.

**제가 무엇을 도와드릴까요?** 궁금한 점이나 특정 작업을 위해 제가 할 수 있는 것이 있다면 말씀해주세요!

total duration:       2.6137723s
load duration:        278.3931ms
prompt eval count:    18 token(s)
prompt eval duration: 168.7498ms
prompt eval rate:     106.67 tokens/s
eval count:           246 token(s)
eval duration:        1.9665249s
eval rate:            125.09 tokens/s

 

C:\>ollama run llama3.2:3b --verbose
>>> 안녕? 너에 대해서 설명해줘
안녕하세요! 난 인공지능(IA) 기반 챗bot으로, human-like 대화를 통해 사용자와 대화할 수 있는 프로그램입니다.

저는 지식 및ความรู้를 가집니다. 사용자가 물어볼 질문이나 문제에 대해 정보를 제공할 때, 저는 그 질문에 대한 답변을 주
어 assistance를 해줄 것입니다.

저는 다양한 주제에 대해 지식을 가지고 있으며, 사용자와의 대화를 통해 배울 수 있는 것들을 포함하여Continuous
learning을 하며 improves됩니다.

만약 사용자에게 도움을 benöt이면, 언제든지 저에게 물어보세요!

total duration:       1.6521448s
load duration:        120.741ms
prompt eval count:    35 token(s)
prompt eval duration: 31.4659ms
prompt eval rate:     1112.32 tokens/s
eval count:           135 token(s)
eval duration:        988.2004ms
eval rate:            136.61 tokens/s

 

 

컨텍스트 길이를 128k 에서 4k로 줄이니까

phi3:14b 모델이 100% GPU로 된다. 오호.. 컨텍스트 길이를 포기해야하나..

C:\>ollama run phi3:14b --verbose
>>> 안녕?
안녕하세요! 나는 지구에 살고 왔습니다. 여러분과 마음을 교환해 보겠습니다.

total duration:       2.0717119s
load duration:        21.2028ms
prompt eval count:    2593 token(s)
prompt eval duration: 274.901ms
prompt eval rate:     9432.49 tokens/s
eval count:           61 token(s)
eval duration:        1.3611884s
eval rate:            44.81 tokens/s

 

C:\>ollama ps
NAME        ID              SIZE      PROCESSOR    CONTEXT    UNTIL
phi3:14b    cf611a26b048    9.2 GB    100% GPU     4096       4 minutes from now

[링크 : https://docs.ollama.com/context-length]

 

아까는 안되더니 컨텍스트 길이 줄이니 된다.

C:\>ollama run gemma4:e4b --verbose
>>> 안녕?
Thinking...
Here's a thinking process that leads to the suggested response:

1.  **Analyze the input:** The input is "안녕?" (Annyeong?), which is a casual Korean greeting, equivalent to
"Hi?" or "Hello?"

2.  **Determine the required response type:** The response must be a natural, reciprocal greeting.

3.  **Formulate the primary greeting (Reciprocation):**
    *   The standard reply to "안녕?" is "안녕?" or "안녕하세요?" (if formal).
    *   Since the input is very casual ("안녕?"), a casual reply is appropriate.
    *   *Choice:* "안녕하세요!" or "안녕!" (The exclamation mark adds energy.)

4.  **Add conversational momentum (The "How are you?" part):** A simple greeting usually prompts a follow-up
question to keep the conversation going.
    *   Korean equivalent: "잘 지내셨어요?" (Jal jinaesyeosseoyo? - How have you been?) or "뭐 하세요?" (Mwo
haseyo? - What are you doing?).
    *   A polite, common opening is: "네, 안녕하세요! 잘 지내셨어요?" (Yes, hello! Have you been well?)

5.  **Select the best options (Offering variety):** Depending on the desired tone (casual, polite, enthusiastic),
multiple responses can be offered.

    *   **Option 1 (Standard/Friendly):** A standard greeting and question. (The safest bet).
    *   **Option 2 (Casual/Warm):** Keep it very relaxed.
    *   **Option 3 (Enthusiastic/Ready to chat):** Expressing excitement.

6.  **Final Polish (Selecting the Korean output):**

    *   *Initial Greeting:* 안녕하세요!
    *   *Follow-up:* 저도 잘 지내고 있어요. 😊 (I'm doing well too.)
    *   *Question back:* 무슨 일로 오셨나요? / 잘 지내셨어요? (What brings you here? / Have you been well?)

7.  **Construct the final Korean and English explanation.** (This results in the provided good response.)
...done thinking.

안녕하세요! 😊

(Annyeonghaseyo! / Hello!)

저는 잘 지내고 있어요. 혹시 무슨 일로 오셨나요? 😊

**[English translation and explanation:]**

*   **안녕하세요! (Annyeonghaseyo!)**: Hello! (This is the standard, polite way to respond.)
*   **저도 잘 지내고 있어요. (Jeodo jal jinaego isseoyo.)**: I'm doing well too.
*   **무슨 일로 오셨나요? (Museun illo osyeonnayo?)**: What brings you here? / What are you doing? (This is a
natural way to prompt the other person to start the topic.)

어떤 이야기를 하고 싶으세요? 😊

total duration:       12.8489232s
load duration:        293.3292ms
prompt eval count:    18 token(s)
prompt eval duration: 58.0091ms
prompt eval rate:     310.30 tokens/s
eval count:           639 token(s)
eval duration:        11.824361s
eval rate:            54.04 tokens/s

 

C:\>ollama ps
NAME          ID              SIZE     PROCESSOR    CONTEXT    UNTIL
gemma4:e4b    c6eb396dbd59    10 GB    100% GPU     4096       About a minute from now
Posted by 구차니
개소리 왈왈/컴퓨터2026. 4. 16. 21:45

1060 6GB -> 1080 Ti 11GB

 

기존설정대로 했더니 FHD 에서 224 프레임

 

4K 에 최고 품질로 했더니 80fps 와우

'개소리 왈왈 > 컴퓨터' 카테고리의 다른 글

지를까 말까  (0) 2026.04.13
iptime 오랫만에 업데이트  (0) 2026.02.24
amd radeon software(아드레날린) 설치  (0) 2026.02.08
dp to usb-c... ?  (0) 2026.02.08
오늘의 줍줍  (0) 2026.01.11
Posted by 구차니

그냥 먼가 새로운 거 없이 바쁜 하루

이걸 좋은거라고 해야하나

나쁜거라고 해야하나

'개소리 왈왈 > 직딩의 비애' 카테고리의 다른 글

금융치료  (0) 2026.04.14
좀 힘든날  (0) 2026.04.13
중고나라 택배거래  (2) 2026.03.10
와 지하철 왜 이따구야?!?  (0) 2026.03.03
내가 뒤쳐지는 건가..  (0) 2026.02.16
Posted by 구차니

음.. 그래픽 카드 사니 기분이 좋아짐

 

 

(어?)

 

 

설마.. 벽돌이 오는건 아니겠지.. 

 

 

(후덜덜)

'개소리 왈왈 > 직딩의 비애' 카테고리의 다른 글

쏘쏘  (0) 2026.04.15
좀 힘든날  (0) 2026.04.13
중고나라 택배거래  (2) 2026.03.10
와 지하철 왜 이따구야?!?  (0) 2026.03.03
내가 뒤쳐지는 건가..  (0) 2026.02.16
Posted by 구차니
개소리 왈왈/컴퓨터2026. 4. 13. 23:29

zotac 1080 ti 11GB

ollama 하다 보니 메모리가 좀 넉넉한게 필요해서

1060 6GB 에서 좀 점프하고 싶어지는데

블로워라서 고민중..

 

아.. 영롱하다

14만 + 5천 vs 근처에서 17만.. 흐음..

 

근데

블랙웰 > 호퍼 > 에이다 러브레이스 > 암페어 > 튜링 > 볼타 > 파스칼

어우.. 너무 구세대이긴 하다 ㅠㅠ

[링크 : https://www.nvidia.com/en-us/technologies/]

'개소리 왈왈 > 컴퓨터' 카테고리의 다른 글

그래픽 카드 교체!  (0) 2026.04.16
iptime 오랫만에 업데이트  (0) 2026.02.24
amd radeon software(아드레날린) 설치  (0) 2026.02.08
dp to usb-c... ?  (0) 2026.02.08
오늘의 줍줍  (0) 2026.01.11
Posted by 구차니

이래서 사람들이 조용한 퇴사를 하는건가

아니면 퇴사를 해야 하는것 인가..

 

[링크 : https://brunch.co.kr/@specterofficial/150]

[링크 : https://www.fortunekorea.co.kr/news/articleView.html?idxno=38156]

'개소리 왈왈 > 직딩의 비애' 카테고리의 다른 글

쏘쏘  (0) 2026.04.15
금융치료  (0) 2026.04.14
중고나라 택배거래  (2) 2026.03.10
와 지하철 왜 이따구야?!?  (0) 2026.03.03
내가 뒤쳐지는 건가..  (0) 2026.02.16
Posted by 구차니
이론 관련/수학 관련2026. 4. 13. 15:19

아는 분과 수다 떨다가 포르자 호라이즌 텔레메트리 정보에서 방향각 관련 변환 이야기 하다 얻은 키워드.

짐벌락 이야기 나오는거 보면 얼핏 본것도 같은데.. 기억이 안나네

회전을 표현하는 다른 방법인 Rotation Matrix(이전글)와 비교했을 때, Quaternion은 회전 계산량이 작으며 메모리 효율적이고, Gimbal Lock(짐벌락) 현상이 발생하지 않는 장점을 갖고 있습니다.
다만 직관적으로 이해하거나 시각화기가 어렵다는 단점을 갖고 있습니다.

[링크 : https://xoft.tistory.com/110]

 

사원수 = 쿼터니안

그래서 i j k 라는데. 사원수면 4개 여야 하는거 아닌가 -ㅁ-?

q0 + q1i + q2j + q3k (실수 성분 하나에 허수 3개로 표시)

[링크 : https://normal-engineer.tistory.com/187]

[링크 : https://normal-engineer.tistory.com/35]

 

일단 대략 머리터짐 -ㅁ-

'이론 관련 > 수학 관련' 카테고리의 다른 글

차원의 저주  (0) 2023.03.18
추세선 알고리즘 (선형회귀)  (0) 2023.03.08
가우스 소거법  (0) 2023.01.19
텐서 합  (0) 2021.06.22
텐서 곱  (0) 2021.06.14
Posted by 구차니

제목이 먼가 드럽게 긴데

네이버 블로그 같은데서

로컬 파일을 읽어서 사용자가 올리듯 이미지를 원하는 위치에 붙여 넣는 방법을 고민중

 

[링크 : https://wikidocs.net/236864] pyperclip - 클립보드 라이브러리

[링크 : https://github.com/asweigart/pyperclip]

[링크 : https://pypi.org/project/pyperclip/]

 

[링크 : https://wikidocs.net/85581] pyautogui - 마우스 자동화

[링크 : https://github.com/asweigart/pyautogui]

[링크 : https://pypi.org/project/PyAutoGUI/]

Posted by 구차니

입력 문장을 전부 입력하는게 아니라

입력 받은 문장을 임베딩하고 그걸 positional encoding 이라는걸 거쳐서

일종의 벡터값으로 입력을 받는 것으로 보인다.

 

 

[링크 : https://jkim83.tistory.com/517]

 

토큰화 및 입력 임베딩
문자, 숫자, 구두점과 같은 글자 단위는 인간이 언어를 표현하는 기본 단위이지만, AI 모델이 사용하는 언어의 최소 단위는 토큰(token)입니다. 각 토큰은 고유한 ID 번호를 부여받으며, LLM은 단어 자체나 토큰 자체가 아니라 이 ID 번호를 통해 어휘 “데이터베이스”를 탐색합니다. 이러한 언어의 토큰화는 텍스트를 처리하는 데 필요한 계산량을 크게 줄여줍니다.

트랜스포머의 어텐션 레이어에 입력할 쿼리 및 키 벡터를 생성하기 위해, 모델은 각 토큰에 대한 초기 문맥 없는 벡터 임베딩이 필요합니다. 이러한 초기 토큰 임베딩은 학습 중에 새롭게 학습되거나, 사전학습된 단어 임베딩 모델에서 가져올 수 있습니다.

위치 인코딩
단어의 순서와 위치는 그 의미론적 의미에 큰 영향을 미칠 수 있습니다. RNN의 직렬적 구조는 각 토큰의 위치 정보를 자연스럽게 보존하지만, 트랜스포머 모델은 어텐션 메커니즘이 이를 고려할 수 있도록 명시적으로 위치 정보를 추가해야 합니다.

위치 인코딩을 사용하면 모델은 입력이 어텐션 메커니즘에 들어가기 전에 상대적 위치에서 파생된 각 토큰의 임베딩에 값 벡터를 추가합니다. 두 토큰이 가까울수록 포지션 벡터는 더 유사해지고, 그에 따라 위치 정보 추가로 인해 정렬 점수가 더 높아집니다. 이렇게 하여 모델은 인접한 토큰에 더 많은 주의를 기울이도록 학습하게 됩니다.

[링크 : https://www.ibm.com/kr-ko/think/topics/transformer-model]

 

의미를 찾는 셀프어텐션
문장을 예로 들어 살펴보겠습니다.

그녀는 주전자의 물을 컵에 따랐다. 그것이 가득 찰 때까지.

여기서 ‘그것’이 컵을 의미한다는 사실을 우리는 쉽게 알 수 있습니다. 그럼 다음의 문장을 보죠.

그녀는 주전자의 물을 컵에 따랐다. 그것이 텅 빌 때까지.

여기서 ‘그것’은 물론 주전자를 의미하겠죠.

구글 브레인(Google Brain)의 수석 연구원으로 앞서 소개한 2017년 논문의 연구를 이끈 아시시 바스와니(Ashish Vaswani)에 따르면 “의미는 사물 간 관계의 결과이고, 셀프어텐션은 관계를 배우는 일반적 방법”입니다.

그는 “기계 번역은 단어 사이의 가깝고 먼 관계들을 파악해야 하는 셀프어텐션의 확립에 좋은 수단이 되어줬습니다”며, “이제 셀프어텐션은 강력하고 유연한 학습의 도구로 완전히 자리매김했습니다”라고 덧붙였습니다.

[링크 : https://blogs.nvidia.co.kr/blog/what-is-a-transformer-model/]

[링크 : https://www.hpe.com/kr/ko/what-is/transformer-model.html]

 

[링크 : https://github.com/ukairia777/tensorflow-transformer/blob/main/Transformer_Korean_Chatbot.ipynb]

[링크 : https://wikidocs.net/31379]

Posted by 구차니