210 oxunuşlar

Yeni fotoşəkillər çox gözəl fotoşəkillər verir

tərəfindən thisweekin...7m2025/06/30
Read on Terminal Reader

Çox uzun; Oxumaq

“Soul” “Higgsfield.ai” şirkətinin ən yeni foto-only modeli və bu, jurnal düyməsinin vizual keyfiyyətini qazanmaq üçün xüsusi hazırlanmışdır.
featured image - Yeni fotoşəkillər çox gözəl fotoşəkillər verir
This Week in AI Engineering HackerNoon profile picture

Hello AI Enthusiasts!

Xatırladaq ki, 25-ci il tarixində"This Week in AI Engineering"!

Bu hafta, OpenAI yeni Deep Research və Webhooks modulları ilə API-ni genişləndirir, Google Gemma 3n-i az resurslu cihazlarda multimodal istifadə üçün təqdim edib və Gemini CLI terminala çatır.Bu arada, Sakana.ai yeniliklər bazarındakı öğretmen modelləri ilə fikirləşmək üçün yeni bir çərşənbə təqdim etdi, Higgsfield Soul adlı şaşırtıcı yeni estetik model atdı və FLUX.1 Kontext geliştiricisi özəl alətlərlə mübahisə edən bir görüntü redaktoru təqdim etdi.

Hər zaman olduğu kimi, hər şeyi sizin diqqətinizə layiq olan radar aletləri və sürətləri ilə dolduracağız.


Higgsfield Soul: The Most Aesthetic AI Photo Model

SoulHiggsfield.ai tərəfindən ən yeni foto-only modeldir və spesifik olaraq hit etmək üçün hazırlanmışdırmagazine-level visual qualityKütlədən çıxıb

AestheticNet Performance

  • “AestheticNet”in texture, lighting, and color fidelity standartlarında 95-ci Percentile Score təşkil edir.
  • “Quiet Luxury”dan “Y2K Retro”na qədər 50+ fashion-grade stil

Technical Highlights

  • Photo-Only Focus: Generalist diffusion modellərindən başqa, Soul still imagery üçün lazer-tuneddir.
  • Precision Inpainting: Çeşitli pozlar və aydınlatma ilə yüzün xüsusiyyətlərini və gözəl ayrıntılarını saxlayır.

Artistic Control

  • Əsas səhiyyə Library: One‐click application of editorial looks.Fine‐Tuning Sliders: Adjust contrast, grain, color saturation, and mood.

Key Use Cases

  • Moda və reklam: Hızlı kampaniyaların yaradılması konsistent branding ilə davam edir.
  • Portrait Services: On-demand profesiyalı headshots və sosial media avatarları.
  • E-ticarət: Studio-grade aydınlanma ilə məhsul fotoları.

FLUX.1 Kontext [dev]: Open Weights, Proprietary-Level Image Editing

Kontext“Flox.1” sistemində yaradılmışdır və bu sistem artıqopen weights modelBu, ən çox istifadə olunan cihazlara bənzəyir.

Model Specs & Open Weights

  • 12 B parametrləri: Yerli və global editlər üçün optimallaşdırılmışdır.
  • Open Non-Commercial License: ComfyUI, Diffusers və TensorRT üçün destek olan Weights on Hugging Face.

Editing Capabilities

  • Xatırladaq ki, bu barədə “Xatırladaq ki, Xatırladaq ki, Xatırladaq ki, Xatırladaq ki, Xatırladaq ki, Xatırladaq ki, Xatırladaq ki, Xatırladaq ki, Xatırladaq ki, Xatırladaq ki, Xatırlama”.
  • Xatırladaq ki, bu problemlər çoxsaylı problemlərin həllindədir.
  • Double-Conditioning: Teksti + görüntüləri tam kontrol üçün çağırışlar.

Benchmark Results

  • KontextBench: Açılmış modellər (t.b. Bagel, HiDream-E1) və qapalı sistemlər (Gemini-Flash Image) insan tercih testlərində üstünlük verir.
  • Optimizasiya variantları: BF16, FP8, FP4 TensorRT variantları hündürlüyü-kalitə kompromisləri üçün.

Integration & Variants

  • “Dev” – tamamilə open-source və araşdırma-fokuslu bir sistemdir.
  • Pro & Max: Daha sürətli renderlər (3-5 s), davamlı tipografiya və korporativ SLA-lar sunan ticari standartlar.

Key Use Cases

  • Creative Toolchains: Web və desktop proqramlarına studio-grade editing daxil edin.
  • Rapid Prototyping: Dizaynçılar vizualdırma konsepti istifadəçilərin hardverində test edə bilərlər.
  • Akademik araşdırma: lisenziyalar barjerları olmadan araşdırma flow matching və iterative editing.

Konteksti yaradıcı alətlər yaratmaq üçün, Kontext lisenziyalarla bağlı heç bir kəşf etməyən, təhlil edilə biləcək bir bazal model verir.


This Might Change LLMs Forever

Sakana.ai yeni bir arkitektura təklif etdi:Reinforcement Learning Teachers of Test Time ScalingGələcəkdə “Türkçülük”in baş məşqçisidir.

Learning‑to‑Teach Framework

  • Soru + Cümə: RLT-lər problemin və onun çözümünün bir-birini alır, açıq, adım-ayrı izahlar hazırlamaya konsantre olurlar.
  • Clarity-Driven Ödülləri: Öğretmenlər, bir öğrenci LLM-nin leksiyasını nə qədər yaxşı internalize etdiyini, öğrencinin log-probabilitasiyası ilə ölçülənə görə ödüllendirilir.

Training Process

  • Dens mükafat sinyalləri: Öğrenci performansından davamlı geri bildirim 7 B parametrli öğretmen modellərində effektiv RL imkan verir.
  • “Destillation-Ready Outputs” (Destillasiya-Həmin Çıxışlar): Açıklama doğrudan aşağılıqlı öğrenci modelləri üçün eğitim verilməsi kimi işləyir.

Performance Benchmarks

  • Konkret işlər: RLT-lər daha böyük LM-ləri istifadə edən boruların performansını üstün tutan öğrencilərə destilasiya edilir.
  • “Zero-Shot Generalization” (Zero-Shot Generalizasiyası): “Out-of-Distribution” referentləri ilə bağlı razılıq verilişini daha çox tune etmədən davam etdirir.

Key Applications

  • Qiymətli Düşüncələr: Yüksek performanslı Düşüncələr köməkçilərini böyük hesablama və ya yeniləmə xərcləri olmadan yaradın.
  • Mühəndislik proqramı: Specializasiya alanları üçün öyrətmək materiallarının automatik yaradılması.
  • On-Demand Fine-Tuning: Farklı RLT öğretmenləri dəyişdirərək öğrencinin modellərini yeni əməllərə uyğunlaşdırmaq.

Əvvəlki məqaləBöyük problemlər var, lakin bubreakthrough for cheaper, more scalable logic-intensive systems.


OpenAI API Adds Deep Research & Webhooks

Açıqlama yeni eklenditwo powerful capabilitiesƏsas səhifə » Əsas səhifə » İŞİDDeep ResearchWebhooksAgent-bazlı proqramlar üçün tamamilə yeni bir intellektual və interaktivlik layerini açmaq.

Deep Research Models

  • o3-deep-research & o4-mini-deep-research: Bu modellər yüzlerce web kaynakında sintezləşdirilir və parçalar yerine strukturlu, citasiya edilmiş xəbərlər qaytarır.
  • Autonomous Multistep Reasoning: Agentlər artıq kompleks problemlər, market araşdırmaları, teknik baxışlar, akademik araşdırmalar, doğrudan koddan başlayabilirlər.

Pricing & Performance

  • O3 Fiyatı: 1M input tokenə 10 dollar, 1M output tokenə 40 dollar.
  • O4‐mini Fiyatı: 1M input token başına 2 dollar, 1M output token başına 8 dollar.
  • “Latency & Reliability”: “Deep Research” və “Webhooks” ilə əlaqə saxlayaraq zaman və ağ problemlərini önləyir.

Webhooks

  • Event-Driven Workflows: Uzun sürətli əməllər (t.b. dərin araşdırma əməlləri) tamamlandıqda çağrıları qəbul edin, bu da sorğuya ehtiyac yoxdur.
  • Secure & Scalable: Authenticated endpoints və strukturlu payloads, batch processing, CI/CD pipelines və ya CRM triggers üçün idealdır.

Key Use Cases

  • “Automated Competitive Analysis: Agents that track and report on new data” (“Yeni şirkətləri izləyən və yenilikləri bildirən agentlər”)
  • Araşdırma köməkçileri: Texnologiya reytinqləri və ya teknik auditları automatik olaraq xəlq edən iş prosesləri qurun.
  • Enterprise Integrations: On-demand deep diving üçün bilet sistemlərinə və ya dashboardlara bağlanmaq.

Bütün bunlar OpenAI-nin API-ni dəyişdirir.dynamic, live agent ecosystemsSadəcə statika deyil.


Google Releases Gemma 3n: Light, Open, Multimodal

“Google” işdən çıxarıldıGemma 3n, Gemini ilə aynı əsas araşdırmalara dayandırılmış, hafif açıq model ailəsinin ən yeni girişidir.

Model Architecture

  • MatFormer Backbone & PLE Caching: Parameter-efficient layers and per-layer embedding caches reduce computing and memory footprint. - Parameter-efficient layers and per-layer embedding caches: Parameter-efficient layers and per-layer embedding caches reduce computing and memory footprint.
  • E2B və E4B variantları: 2 B və 4 B parametr boyutlarında, müxtəlif performans-efektivlik kompromisları üçün optimize edilmişdir.

Multimodal & Multilingual

  • Giriş türləri: Textu, görüntüləri, video və audio üçün yerli dəstək.
  • Təsadüfi dil: 140-dən çox danışıq dili; multimodal işlər üçün 35 dili.

Efficiency & On‑Device Performance

  • Offline Inference: Runs entirely on-device, ideal for privacy‑sensitive or low‑connectivity scenarios.
  • 2 GB RAM Footprint: Smartfonlar, tabletlər və edge hardware-də AI-ni bulud bağımlılığı olmadan təmin edir.

Key Use Cases

  • Mobil köməkçilər: Ses, görüntülər və tekst sorğuları anlayan lokal chatbotlar.
  • “Privacy-First Apps” (Privacy-First Apps) – xəstəxanada və ya finansda data heç vaxt cihazdan ayrılmır.
  • Field Research: Offline çeviri və uzaq yerlər üçün multimodal analiz.

Yerli AI köməkçileri, mobil multimodal uygulamalar və ya çox dilli chat interfeisləri yaratırsanız,Gemma 3n is a powerful, open alternative to proprietary multimodal giants.


Gemini CLI Brings AI to the Terminal

“Google” da işə başlayıbGemini CLI, Gemini doğrudan dev terminalınıza daxil edən açıq-aşkar komandanın interfeşi.

Features & Integrations

  • Natural-Language Prompts: Code Generation, bug fix, dokumentasiya, araşdırma sorğu.
  • MCP & Real-Time Data: Google'ın Model Context Protokolunu istifadə edir, istədikləri zaman canlı web verilərini alır.
  • Multimodal Extensions: Imagen və Veo ilə görüntülər / video istehsal üçün entegrasiyalar.

Performance & Limits

  • 60 prosedur / dəqiqə və 1000 prosedur / gündə pulsuz (Gemini Code Assist lisenziyası ilə).
  • 1 M token kontekst pencerəsi kompleks, çox-sürət promptlər üçün.

Developer Experience & Extensibility

  • Tamamilə Open-Source: Kodu araşdırmaq, plug-inləri dəstəkləmək, funksiyaları genişləndirmək.
  • ReAct Loop: Yerli alətlər, skriptlər və bulud xidmətlərini zəncirləndirmək üçün Razon-and-act framework.

Key Use Cases

  • "Terminal-First Workflows" (Terminal-First iş prosesləri): Şəkilləri sevirlər üçün kontekst dəyişdirməyi azaldır.
  • CI/CD Automation: Scripted AI kodun keyfiyyətini və ya işin orkestrasiyasını kontrol edir.
  • Ad-hoc araşdırma: Terminaldan çıxmaq olmadan sürətli içerik xətti və data aradan qaldırmaq.

Konteksti dəyişdirməkdən yorulmuş müxaliflər üçün, Gemini CLI, yazdırabilirsiniz.


Tools & Releases YOU Should Know About

Warp 2.0VVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu.

Gru.aiVVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu.

GoCodeoVVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu.

Swimm“Swimm” şirkəti “VSCode”, “JetBrains”, “IntelliJ” və “PyCharm” kimi IDE-lərə doğrudan endirir. “Swimm” şirkəti “VSCode”, “JetBrains”, “IntelliJ” və “PyCharm” kimi IDE-lərə doğrudan endirir. “Swimm” şirkəti “Swimm” şirkəti “Swimm” şirkəti “Swimm” şirkəti “Swimm” şirkəti “Swimm” şirkəti “Swimm” şirkəti “Swimm” şirkəti “Swimm” şirkəti “Swimm” şirkəti “Swimm” şirkəti “Swimm” şirkəti “Swimm” şirkəti “Swim” şirkəti “Swim” şirkəti “Swim” şirkəti


Bu problemin həllini davam etdirir”.This Week in AI Engineering."

Xatırladaq ki, bu mesajı dostlarınızla paylaşın və daha çox güncellemələr edin.

Sonrakı xəbərGözəl inşaat!

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks