Памятаеце, у казках Баба-Яга збірае вакол сябе жывых істот, каб даведацца пра незвычайныя навіны свету. І вы будзеце рабіць гэта, калі вы будзеце рабіць, калі вы будзеце рабіць. Легка Гэта кошмары для нічога серыйнага: тэкст павагі, дадзеныя трубопроводы, генерацыя кода, або "не засмучайце мяне перад камандай" вынікаў. Вось і ўдасканаленне: . Prompt Reverse Engineering Гэта так, як гэта выглядае: , а затым прымяняць таргетаваныя выпрабаванні - як дэбагмент, а не гадаванне. use the model’s wrong answer to backtrack into what your prompt failed to define Падумайце пра злы вынік, як ваш мадэль, як сказаць: «Вы не сказалі мне, што важна». «Вы не сказалі мне, што важна». Давайце ператворым гэта ў паўторны працоўны працэс. Чаму інверсійная інжынерыя б'е выпадковы промпт tweaking Часам, калі вы напішыце "хорошы выгляд" памочнік (ясна запрашаць, ўласны тон, разумныя абмежаванні), мадэлі ўсё ж прапусцілі: Час, які вам цікавіцца, Усё тое, што вы чакаеце, Вызначыўся з працай, які купіў кватэру. ролі, у якой вы хочаце, каб мадэль засталася, Узнагароджанне слова «правільна». Адваротная інжынерыя дае вам метад, каб знайсці непаўторны спектр — Без наблытання вашага поспеху ў раман. fast Чытайце таксама: Чытайце таксама: Чытайце таксама: Четыре режима провала (и что они действительно говорят вам) Калі вы хочаце падзяліцца сваёй думкай з майстрам, рабіце гэта максімальна ветліва. 1) Фактычныя няправільнасці Адказ упэўнена заяўляе невядомыя факты, змяшае гады, або выдумае лічбы. Symptom: Задачы, насычаныя ведамствамі: рыночныя дадзеныя, акадэмічнае пісаванне, сумы палітыкі. Typical trigger: What your prompt likely missed: выразны часовы диапазон («календарны год 2023 года» супраць «последніх 12 месяцаў»), патрабаванні крыніцы (цытаты, названыя наборы дадзеных), Памятаеце, калі мадэль не ведае. Вы запрашаеце: Мадэль адказвае, выкарыстоўваючы лічбы 2022 года і ніколі не кажа, дзе яна атрымала іх. Example (UK-flavoured): «Аналіз 3 найбуйнейшых брэндаў аўтамабіляў па сусветным продажы ў 2023 годзе». Prompt patch pattern: Додавайце «граніцу фактаў»: год, геаграфія, адзінка. Прагрэсіраваць цитаты або прозрачны «Я не ўпэўнены». Дазволілі гэта, я так адчуваю, таму, што ўсё начальства ўжо святкавала Новы год. 2) Разбітыя логікі / прапушчаныя крокі Выпуск выглядае правёўным, але ён прапусціць крокі, скакаць высновы, або даставіць «аутлайн» выказваючыся як працэс. Symptom: Працэдуры, дэбютаванне, шматступенневыя размовы, архітэктурныя планы. Typical trigger: What your prompt likely missed: «Увесь ключавы крок» “Расказаць залежнасць / заказ” “Выкарыстоўвайце фіксаваную рамку (Checklist / pipeline / рецепт)” Вы запрашаеце: Ён запісвае толькі «выпрацаваць непаўторныя значэнні» і «вылучыць выключэнні» і называе гэта днём. Example: «Прыкласці поўны працоўны працэс ачысткі дадзеных Python». Prompt patch pattern: Націсніце наступствы (A → B → C → D). Запрашаем на заказ. Прагрэсіраваць тэст адказу («Як я ведаю, што гэты крок патрабуецца?»). 3) Форма дырэктара Вы запрашаеце за табліцу Markdown / JSON / YAML / код блока... і ён вяртае дружны параграф, як гэта напісаць блог-пост. Symptom: Усё, што значыць для машынаў: структурыраваны выхад, файлы канфігурацыі, выдатныя нагрузкі, табліцы. Typical trigger: What your prompt likely missed: строгасць («выпуск важны толькі для JSON»), Схема абмежаванняў (ключы, тыпы, патрабаваныя поля) У гэтым выпадку пешаходы, якія сканчаюць пераход, уяўляюць істотную небяспеку (мал. Вы запрашаеце: Ён адказвае ў празе і змяшчае продавец + дату выпуску ў адным слове. Example: "Дайце мне табліцу Markdown трох папулярных LLMs". Prompt patch pattern: Дадаць схему, плюс “без дадатковых ключоў”. Давайце паглядзім на «No Prose Outside the Block». Давайце паглядзім на маленькі прыклад. 4) ролі / тон дрыф Вы запрашаеце падрабязнае падрабязнае падрабязнае падрабязнае падрабязнае падрабязнае выданне. Symptom: Roleplay, падтрымка кліентаў, коучинг, stakeholder comms. Typical trigger: What your prompt likely missed: як ролі размаўляюць (цікавы ўзровень, цепласць, табу жаргон), першапачатковай мэтай ролі (забяспечыць, пераканаць, дээскалаваць), Забаронены кантэнт (“абмяжоўвайце медыцынскі жаргон; вызначыце тэрміны, калі гэта непазбежна”). Prompt patch pattern: Узнагароджанне аўдыторыі («зацікаўленыя бацькі», «джуніорны інжынер», «CTO»). Вызначаць правілы тону («Дружны, не суддзя, Англійская мова»). Давайце размаўляем пра Do/Don’t Vocabulary. Пяць крокаў назад інжынернага працэсу Усё, што вы чулі пра карысць пара раней - усяго толькі чуткі і павер'і. Крок 1: Націсніце адрозненне (пазнайце дакладнае прозвішча) Укладайце больш ва ўласную журналістыку, СМІ і змагайцеся за свабоду слова. Прыкладныя Checklist: З тых часоў мінула 2023 год. З тых часоў прайшло гадоў: 62. З тых часоў прайшло гадоў: Вынікі пошуку - top 3 Калі вы не можаце апісаць міс дакладна, вы не можаце вырашыць яго дакладна. Крок 2: Infer the missing spec (памятны дефект) Для кожнага з іх запрашаем: Якая інструкцыя б гэта запомніла? Якая невядомасць мадэль «вырашыла» ў няправільным напрамку? Характэрныя варыянты: Неабходная мяжа (час, краіна, адзінка) Неабходнасць да абмежавання, Неабходнае выкананне плана, Неабходныя таленты і ролі. Крок 3: Выпрабаванне гіпотэзы з мінімальным рэдактарам Не перапісвайце ўвесь праспект. Пацкніце адзін варыянт і перазагрузіць. Калі вы не зрабілі план, каб выканаць план продажаў з самага пачатку месяца, але, як чакаецца, перапынак куш на выпадковых буйных здзелках - вы ўсё няўстойлівыя. Шаг 4: Зацвярджаецца метадавая мадэль апытання Як толькі гэта будзе зроблена, трэба набыць найменшы ўзровень: Граничная клауза: «Выкарыстоўвайце дадзеныя 2023 (ян-дэк); калі невядома, скажыце так». Схема клаузула: «Вартаваць важны JSON адпавядае гэтай схеме...» Клауза абкрыцця: “Уключайце гэтыя 6 крокаў...” «Выказвай, як я новы, а не жаргон». Крок 5: Запішыце змяненне (будуйце свой спам-ліст змяненняў) Гэта частка, якую большасць людзей прапусціць — і частка, якая пераходзіць у інжынерную практыку. Захоўвайце маленькую кнігу: Першапачатковыя Мадэль, якая не спрацавала Невядомыя гіпотезы Папярэдні Тэкст Вынікі З цягам часу вы будзеце будаваць асабістую бібліятэку “загубленне звычайнай → стандартны патч”. Уступнае слова і пераклад Уладзіміра Правасуда. // Братэрства 87. Давайце робім справу правільна. Першы поспех «Выкарыстанне Python, напішыце поўны працэс ачысткі дадзеных з крокамі і кодам». «Выкарыстанне Python, напішыце поўны працэс ачысткі дадзеных з крокамі і кодам». Вынікі пошуку - Bad Output Ён вяртае толькі два элементы: Запішыце непаўторныя значэнні Сцягнуць Outliers І гэта дэманструе код без кантэксту, без параду і без канцэпцый. Інтэрв'ерны інжынерны дыягноз Deviation points Неабходныя асноўныя крокі (двойнікі, тып лячэння, стандартызацыя) Без адказу на заказ Код адсутнічае каментарыі і прыкметы прымянення Prompt defects Няма “ядровага спісу крокаў” → мадэль выбірае частковы падсьвет Ніякіх абмежаванняў на заказ → мадэль выпуску ў самастойным парадку Няма “заявіць, калі выкарыстоўваць” → код становіцца копія/пастаўка байт Папярэдні Тэкст (але мінімальна) Для забеспячэння работы мікра-ГЭС, водны струмень мусіць быць штучна створаны. duplicates → 2) data types → 3) missing values → 4) outliers. For each step include: purpose, when it applies, and commented code. Also state how to detect whether the step is needed.” Для забеспячэння работы мікра-ГЭС, водны струмень мусіць быць штучна створаны. Двойчы → 2) тыпы дадзеных → 3) непаўторныя значэнні → 4) выключэнні. Для кожнага кроку ўключаюць: мэту, калі яна прымяняецца, і каментаваны код. таксама ўказаць, як вызначыць, ці патрэбны крок. Што выглядае (як выглядае добра) Ніжэй ёсць а Памятаеце, што мы не можам адрознівацца ад харчавання. І мы зразумелі, што мы зразумелі, што мы зразумелі. slightly tweaked fillna(0) import pandas as pd def clean_frame(df: pd.DataFrame) -> pd.DataFrame: # 1) Duplicates: reduce noise before anything else dup_count = df.duplicated().sum() if dup_count: df = df.drop_duplicates().copy() # 2) Types: make sure comparisons and maths behave # Example: parse dates if you expect time-series logic later if "created_at" in df.columns: df["created_at"] = pd.to_datetime(df["created_at"], errors="coerce") # 3) Missing values: strategy depends on data type and meaning for col in df.columns: if df[col].isna().any(): if pd.api.types.is_numeric_dtype(df[col]): # Use median for robustness (less sensitive than mean) df[col] = df[col].fillna(df[col].median()) else: # For categorical/text, choose a clear placeholder df[col] = df[col].fillna("Unknown") # 4) Outliers: apply only to numeric columns where it makes sense num_cols = df.select_dtypes(include="number").columns for col in num_cols: q1 = df[col].quantile(0.25) q3 = df[col].quantile(0.75) iqr = q3 - q1 if iqr == 0: continue # no spread, no meaningful outliers lower = q1 - 1.5 * iqr upper = q3 + 1.5 * iqr df = df[(df[col] >= lower) & (df[col] <= upper)] return df Гэта не «выдатная чыстка дадзеных» (што залежыць ад домена), але гэта У гэтым выпадку пешаходы, якія сканчаюць пераход, уяўляюць істотную небяспеку (мал. І Скрытая пастка: межы мадэлі магчымасці Але ж у параўнанні з іншымі сядзібамі, якіх ужо не вернеш — хіба толькі ў выглядзе копіі-”навабуда”, — свяцкай надзвычай пашчасціла. Калі вы бачыце той жа фактычны няўдачы пасля затяжэння межаў і просьбы па крыніцах, перастаньце круціцца. Давайце паглядзім на Sane Fallback: «Калі ты не ведаеш, скажы, што не ведаеш». «Запішыце апошні год, у які вы ўпэўненыя». «Сказаць, якія крыніцы я магу кансультаваць». Гэта змяняе галюцинацыю ў карысную адказу. Помні, што многія і многія зараз надломваюцца . Папярэдні Тэкст “Please be correct” як выпрабаванне Гэта не абмежаванне, гэта жаданне. Замест: вызначыць правільнасць з дапамогай межаў + праверка + падступ. Афіцыйная назва: Over-Constraining Everything Калі вы выправіце адзін варыянт, дадаўшы дзесяць невядомых правіл, вы атрымаеце неадкладна наблытаньне і пагоршае спажыванне. Пакрывайце вашы няўдачы, а не ваш страх. Міф 3: Не валідаваць сваю гіпотэзу Вы не можаце заявіць, што выпрабаванне спрацавала, калі вы не перазагрузіць яго з мінімальным патч і бачыць чаканы паляпшэнне. Трэці варыянт – гэта экзамен на экзамен. Пытанні, якія часта задаюць пра вегетарыянства Затрымаць таксаномію няўдачы (факты / логіка / формат / роля). Выкарыстоўвайце One-Patch-Per-Run пры дэбютаванні. Пабудаваць спампаваць changelog (серыяльна, гэта код шахмат). Калі вам патрэбна структура, выкарыстоўвайце схемы + маленькія прыклады. Калі вам патрэбна надзейнасць, патрабуйце выяўлення невядомасці. Невядомыя адказы не толькі раздражняюць - яны Калі вы навучыцеся чытаць іх, вы спыняеце «прабуюць» і пачынаеце . інфармацыя engineering