Техніки промптингу для покращення використання великих мовних моделей

Робота присвячена дослідженню базових технік складання запитів для підвищення ефективності використання великих мовних моделей. Значну увагу приділено питанню інженерії запитів (промптингу). Детально розглянуто різноманітні техніки: промптинг без зразка, зі зворотним зв’язком, з кількома прикладами, ланцюжкове мислення, дерево думок, інструкція для налаштування. Значну увагу приділено технологіям Реакція та Дія (Reaction & Act Prompting) та Доповнена пошукова генерація (Retrieval Augmented Generation, RAG) як критично важливих чинників забезпечення ефективної взаємодії з ВММ. Висвітлено особливості застосування цих технік та їхній вплив на результат. Однак, використання повного потенціалу вимагає ретельного підходу та врахування особливостей застосування. Здійснено огляд параметрів великих мовних моделей, таких як температура, тop P, максимальна кількість токенів, стоп-послідовності, штрафи за частоту та присутність тощо. Зазначено, що розроблення запитів є ітеративним процесом, який передбачає послідовне випробування різних варіантів для досягнення оптимальних результатів. Всі наведені у дослідженні техніки підкріплено наочними прикладами з отриманими результатами. Зазначено, для яких типів дана техніка буде більш доречною. У результатах дослідження наведено порівняння як базових технік, так і складніших технологій ReAct та RAG. Інженерія запитів — це ключова технологія ефективного використання великих мовних моделей. Вона актуальна у зв’язку зі зростанням застосування штучного інтелекту у всіх сферах діяльності людства, і її роль лише збільшуватиметься з розвитком технологій. Вміння правильно формулювати запити стає важливою на- вичкою, необхідною для роботи з сучасними великими моделями, особливо в умовах їхньої універсальності та складності.
The work is dedicated to the study of fundamental prompting techniques to improve the efficiency of using large language models (LLMs). Significant attention is given to the issue of prompt engineering. Various techniques are examined in detail: zero-shot prompting, feedback prompting, few-shot prompting, chain-of-thought, tree of thoughts, and instruction tuning. Special emphasis is placed on Reaction & Act Prompting and Retrieval Augmented Generation (RAG) as critical factors in ensuring effective interaction with LLMs. The features of applying these techniques and their impact on results are highlighted. However, leveraging their full potential requires a careful approach and consideration of application specifics. A review of the parameters of large language models, such as temperature, top P, maximum number of tokens, stop sequences, frequency and presence penalties, etc., is provided. It is noted that prompt development is an iterative process that involves sequential testing of different options to achieve optimal results. All techniques discussed in the study are supported by illustrative examples with obtained results. It is indicated which types of tasks each technique is more suitable for. The study results include comparisons of both fundamental techniques and more advanced technologies such as ReAct and RAG. Prompt engineering is a key technology for the effective use of large language models. It is relevant due to the increasing application of artificial intelligence in all areas of human activity, and its role will only grow with the development of technology. The ability to correctly formulate prompts is becoming an important skill necessary for working with modern large models, especially given their versatility and complexity.

Keywords

великі мовні моделі, інженерія запитів, промптинг, техніки запи- тів, генерування контенту, large language models, prompt engineering, prompting technique, content generation

Citation

Техніки промптингу для покращення використання великих мовних моделей / І. Ю. Юрчак, О. О. Кичук, В. М. Оксентюк, А. О. Хіч // Комп'ютерні системи та мережі. — Львів : Видавництво Львівської політехніки, 2024. — Том 6. — № 2. — С. 268–285.

URI

https://ena.lpnu.ua/handle/ntb/123986

Collections

Комп'ютерні системи та мережі. – 2024. – Том 6, № 2

Full item page

Техніки промптингу для покращення використання великих мовних моделей

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

URI

Collections

Endorsement

Review

Supplemented By

Referenced By