<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Fine tuning on 세모난 책</title><link>https://semonan.com/kr/book/ai/fine-tuning/</link><description>Recent content in Fine tuning on 세모난 책</description><generator>Hugo</generator><language>ko-KR</language><lastBuildDate>Sun, 07 Jul 2024 00:00:00 +0000</lastBuildDate><atom:link href="https://semonan.com/kr/book/ai/fine-tuning/rss.xml" rel="self" type="application/rss+xml"/><item><title>LoRA</title><link>https://semonan.com/kr/book/ai/fine-tuning/lora/</link><pubDate>Sun, 07 Jul 2024 00:00:00 +0000</pubDate><guid>https://semonan.com/kr/book/ai/fine-tuning/lora/</guid><description>&lt;link rel="stylesheet" href="https://semonan.com/katex/katex.min.css" /&gt;&lt;script defer src="https://semonan.com/katex/katex.min.js"&gt;&lt;/script&gt;&lt;script defer src="https://semonan.com/katex/auto-render.min.js" onload="renderMathInElement(document.body, {&amp;#34;delimiters&amp;#34;:[{&amp;#34;left&amp;#34;:&amp;#34;$$&amp;#34;,&amp;#34;right&amp;#34;:&amp;#34;$$&amp;#34;,&amp;#34;display&amp;#34;:true},{&amp;#34;left&amp;#34;:&amp;#34;$&amp;#34;,&amp;#34;right&amp;#34;:&amp;#34;$&amp;#34;,&amp;#34;display&amp;#34;:false},{&amp;#34;left&amp;#34;:&amp;#34;\\[&amp;#34;,&amp;#34;right&amp;#34;:&amp;#34;\\]&amp;#34;,&amp;#34;display&amp;#34;:true},{&amp;#34;left&amp;#34;:&amp;#34;\\(&amp;#34;,&amp;#34;right&amp;#34;:&amp;#34;\\)&amp;#34;,&amp;#34;display&amp;#34;:false}]});"&gt;&lt;/script&gt;
&lt;h1 id="lora-low-rank-adaptation"&gt;LoRA (Low-Rank Adaptation)&lt;a class="anchor" href="#lora-low-rank-adaptation"&gt;#&lt;/a&gt;&lt;/h1&gt;
&lt;p&gt;LoRA는 PEFT(Parameter-Efficient Fine-Tuning) 기술 중 하나입니다.&lt;br&gt;
이 기술은 대형 사전 학습 모델을 특정 작업에 맞게 효율적으로 Fine tuning 하는 방법입니다.&lt;/p&gt;
&lt;p&gt;(다음 내용은 논문 &amp;ldquo;LoRA: Low-Rank Adaptation of Large Language Models&amp;rdquo; 를 참고하였습니다.)&lt;/p&gt;
&lt;h2 id="배경문제"&gt;배경/문제&lt;a class="anchor" href="#%eb%b0%b0%ea%b2%bd%eb%ac%b8%ec%a0%9c"&gt;#&lt;/a&gt;&lt;/h2&gt;
&lt;p&gt;LLM(Large Language Model) 같은 Model은 파라미터 수가 매우 많습니다.&lt;br&gt;
예로, 24년 4월 출시된 llama3 model의 Parameter 수는 약 700억개이며 File 크기가 40GB가 넘으며, 이보다 더 큰 Model도 많습니다.&lt;br&gt;
이런 Large model을 Full fine tuning 하려면 고성능 GPU가 필요하며 학습 시간도 긴 편입니다.&lt;br&gt;
또한, Base model을 Full fine tuning 하는 것은 Pretraining에서 학습된 기본 성능을 저하 시킬 여지가 있습니다.&lt;/p&gt;</description></item></channel></rss>