Параметры генерации:
simplear - do_sample=false;until=["\n"];
\nchegeka - do_sample=false;until=["\n"];
\nrudetox - do_sample=false;until=["\n"];
\nrumultiar - do_sample=false;until=["\n"];
\nuse - do_sample=false;until=["\n","."];
\nmultiq - do_sample=false;until=["\n"];
\nrumodar - do_sample=false;until=["\n"];
\nruhumaneval - do_sample=true;until=["\nclass","\ndef","\n#","\nif","\nprint"];temperature=0.6;
\nrucodeeval - do_sample=true;until=["\nclass","\ndef","\n#","\nif","\nprint"];temperature=0.6;
Размер контекста:
simplear, bps, lcs, chegeka, mathlogicqa, parus, rcb, rudetox, ruhatespeech, rummlu, ruworldtree, ruopenbookqa, rumultiar, use, rwsd, mamuramu, multiq, rumodar, ruethics, ruhhh, ruhumaneval, rucodeeval, rutie - 131072
\nrutie - 5000
Системный промпт:
Реши задачу по инструкции ниже. Не давай никаких объяснений и пояснений к своему ответу. Не пиши ничего лишнего. Пиши только то, что указано в инструкции. Если по инструкции нужно решить пример, то напиши только числовой ответ без хода решения и пояснений. Если по инструкции нужно вывести букву, цифру или слово, выведи только его. Если по инструкции нужно выбрать один из вариантов ответа и вывести букву или цифру, которая ему соответствует, то выведи только эту букву или цифру, не давай никаких пояснений, не добавляй знаки препинания, только 1 символ в ответе. Если по инструкции нужно дописать код функции на языке Python, пиши сразу код, соблюдая отступы так, будто ты продолжаешь функцию из инструкции, не давай пояснений, не пиши комментарии, используй только аргументы из сигнатуры функции в инструкции, не пробуй считывать данные через функцию input. Не извиняйся, не строй диалог. Выдавай только ответ и ничего больше.
Описание темплейта:
{{- bos_token }}
\n{%- if custom_tools is defined %}
\n {%- set tools = custom_tools %}
\n{%- endif %}
\n{%- if not tools_in_user_message is defined %}
\n {%- set tools_in_user_message = true %}
\n{%- endif %}
\n{%- if not date_string is defined %}
\n {%- set date_string = "26 Jul 2024" %}
\n{%- endif %}
\n{%- if not tools is defined %}
\n {%- set tools = none %}
\n{%- endif %}
\n
\n{#- This block extracts the system message, so we can slot it into the right place. #}
\n{%- if messages[0]['role'] == 'system' %}
\n {%- set system_message = messages[0]['content']|trim %}
\n {%- set messages = messages[1:] %}
\n{%- else %}
\n {%- set system_message = "" %}
\n{%- endif %}
\n
\n{#- System message + builtin tools #}
\n{{- "<|start_header_id|>system<|end_header_id|>\n\n" }}
\n{%- if builtin_tools is defined or tools is not none %}
\n {{- "Environment: ipython\n" }}
\n{%- endif %}
\n{%- if builtin_tools is defined %}
\n {{- "Tools: " + builtin_tools | reject('equalto', 'code_interpreter') | join(", ") + "\n\n"}}
\n{%- endif %}
\n{{- "Cutting Knowledge Date: December 2023\n" }}
\n{{- "Today Date: " + date_string + "\n\n" }}
\n{%- if tools is not none and not tools_in_user_message %}
\n {{- "You have access to the following functions. To call a function, please respond with JSON for a function call." }}
\n {{- 'Respond in the format {"name": function name, "parameters": dictionary of argument name and its value}.' }}
\n {{- "Do not use variables.\n\n" }}
\n {%- for t in tools %}
\n {{- t | tojson(indent=4) }}
\n {{- "\n\n" }}
\n {%- endfor %}
\n{%- endif %}
\n{{- system_message }}
\n{{- "<|eot_id|>" }}
\n
\n{#- Custom tools are passed in a user message with some extra guidance #}
\n{%- if tools_in_user_message and not tools is none %}
\n {#- Extract the first user message so we can plug it in here #}
\n {%- if messages | length != 0 %}
\n {%- set first_user_message = messages[0]['content']|trim %}
\n {%- set messages = messages[1:] %}
\n {%- else %}
\n {{- raise_exception("Cannot put tools in the first user message when there's no first user message!") }}
\n{%- endif %}
\n {{- '<|start_header_id|>user<|end_header_id|>\n\n' -}}
\n {{- "Given the following functions, please respond with a JSON for a function call " }}
\n {{- "with its proper arguments that best answers the given prompt.\n\n" }}
\n {{- 'Respond in the format {"name": function name, "parameters": dictionary of argument name and its value}.' }}
\n {{- "Do not use variables.\n\n" }}
\n {%- for t in tools %}
\n {{- t | tojson(indent=4) }}
\n {{- "\n\n" }}
\n {%- endfor %}
\n {{- first_user_message + "<|eot_id|>"}}
\n{%- endif %}
\n
\n{%- for message in messages %}
\n {%- if not (message.role == 'ipython' or message.role == 'tool' or 'tool_calls' in message) %}
\n {{- '<|start_header_id|>' + message['role'] + '<|end_header_id|>\n\n'+ message['content'] | trim + '<|eot_id|>' }}
\n {%- elif 'tool_calls' in message %}
\n {%- if not message.tool_calls|length == 1 %}
\n {{- raise_exception("This model only supports single tool-calls at once!") }}
\n {%- endif %}
\n {%- set tool_call = message.tool_calls[0].function %}
\n {%- if builtin_tools is defined and tool_call.name in builtin_tools %}
\n {{- '<|start_header_id|>assistant<|end_header_id|>\n\n' -}}
\n {{- "<|python_tag|>" + tool_call.name + ".call(" }}
\n {%- for arg_name, arg_val in tool_call.arguments | items %}
\n {{- arg_name + '="' + arg_val + '"' }}
\n {%- if not loop.last %}
\n {{- ", " }}
\n {%- endif %}
\n {%- endfor %}
\n {{- ")" }}
\n {%- else %}
\n {{- '<|start_header_id|>assistant<|end_header_id|>\n\n' -}}
\n {{- '{"name": "' + tool_call.name + '", ' }}
\n {{- '"parameters": ' }}
\n {{- tool_call.arguments | tojson }}
\n {{- "}" }}
\n {%- endif %}
\n {%- if builtin_tools is defined %}
\n {#- This means we're in ipython mode #}
\n {{- "<|eom_id|>" }}
\n {%- else %}
\n {{- "<|eot_id|>" }}
\n {%- endif %}
\n {%- elif message.role == "tool" or message.role == "ipython" %}
\n {{- "<|start_header_id|>ipython<|end_header_id|>\n\n" }}
\n {%- if message.content is mapping or message.content is iterable %}
\n {{- message.content | tojson }}
\n {%- else %}
\n {{- message.content }}
\n {%- endif %}
\n {{- "<|eot_id|>" }}
\n {%- endif %}
\n{%- endfor %}
\n{%- if add_generation_prompt %}
\n {{- '<|start_header_id|>assistant<|end_header_id|>\n\n' }}
\n{%- endif %}