AI news ! Google, OpenAI, Samsung, Alibaba and more..

Huge Discount: Use the coupon – WINTER40

ChatGPT and AI Master Course

Original price was: 25,000.00৳ .Current price is: 12,500.00৳ .

FULL VIDEO:

1) Grok Imagine 3.1 — ফাস্ট মেমে/ক্লিপ জেনারেটর
ইমেজ/টেক্সট থেকে দ্রুত ছোট ভিডিও বানাতে পারে।
নরমাল/ফান/কাস্টম/“স্পাইসি”—চারটা অ্যানিমেশন মোড আছে।
হালকা প্রজেক্ট, টিজার, মিম ভিডিও—দ্রুত বানাতে ভালো।
এখনও “প্রো-লেভেল” না, কিন্তু আইডিয়া টেস্টিংয়ে দারুণ ফাস্ট।
👉 লিংক: grok.com/imagine

2) Apps in ChatGPT — ইন-চ্যাট অ্যাপ + ডেভ SDK (MCP)
চ্যাটের ভেতরেই মিনি-অ্যাপ চালানো যাবে—UI ইন্টারঅ্যাকশন লাইভ।
ডেভেলপারদের জন্য Apps SDK—ওয়ার্কফ্লো-টাইপ এক্সপেরিয়েন্স।
নো-কনটেক্সট-সুইচ—ইউজার-সাইডে টাইম সেভিং।
👉 লিংক: openai.com/index/introducing-apps-in-chatgpt

3) AgentKit (OpenAI) — এন্ড-টু-এন্ড এজেন্ট প্ল্যাটফর্ম
অর্কেস্ট্রেশন, কানেক্টর, ইভ্যাল, প্রম্পট-স্টোর—এক ছাতার নিচে।
ভিজ্যুয়াল ফ্লো/চ্যাটকিট UI—এম্বেডেবল ফ্রন্টএন্ড ব্লকস।
n8n-স্টাইল অটোমেশন-ফিল, কিন্তু LLM-নেটিভ।
👉 লিংক: openai.com/index/introducing-agentkit

4) Google OPAL — ফ্রি-স্টাইল এজেন্ট/অটোমেশন (রেফারেন্স)
ফ্রি-ওরিয়েন্টেড সলিউশন—এজেন্ট/ওয়ার্কফ্লো এক্সপেরিমেন্টে ইউজফুল।
প্রাইসিং-ফ্রিকশন কম, টেস্ট-অ্যান্ড-বিল্ড ইজি।
(প্রিভিয়াস ভিডিও )

5) Sora 2 / Sora 2 Pro API — ওয়াটারমার্ক-অন, প্রোড রেডি
টেক্সট-টু-ভিডিও কোয়ালিটিতে বড় লীপ—ফিজিক্স/ক্যামেরা মুভ বেটার।
API ওয়ার্কফ্লো-ফ্রেন্ডলি, কিন্তু জেনারেটেড কনটেন্টে ওয়াটারমার্ক অন।
শর্ট-ফর্ম অ্যাড/ডেমো—স্টুডিও-লেভেল আউটপুট সম্ভব।
👉 রেফ: Sora 2 API (অফিশিয়াল পোস্ট/ডক্স দেখান)

6) Wan 2.5 (Alibaba) — একসাথে অডিও + ভিডিও জেনারেশন
Hook: অডিও-ভিডিও দুইটাই এক মডেলে—কন্টেন্ট-ওয়ার্কফ্লো স্মুথ।
ভয়েস/সাউন্ড ডিজাইনসহ সিন জেনারেট করতে পারে—স্টোরিটেলিং ইজি হয়।
কনসিস্টেন্সি ও টেম্পো কন্ট্রোলে আগের ভার্সনের চেয়ে রিফাইনড।
শর্টস/অ্যাড/প্রোডাক্ট ডেমো—এন্ড-টু-এন্ড জেনারেটিভ ফ্লো সম্ভব।
👉 রেফ: Alibaba “Wan 2.5” (PDF লিস্টেড; অফিসিয়াল পেজ না থাকলে ‘Wan family’ সার্চ দেখাতে পারেন)

7) Wan-Alpha — ট্রান্সপারেন্ট (RGBA) ভিডিও, কাট-আউট রেডি
ব্যাকগ্রাউন্ড বাদ দিয়ে ডিরেক্ট RGBA ভিডিও দেয়—কম্পোজিটিং সুপার-ফাস্ট।
হেয়ার/স্মোক/গ্লাসের মতো সূক্ষ্ম ডিটেইলও ঠিকমতো থাকে।
VFX, AR, গেম UI—প্লাগ-অ্যান্ড-প্লে ইউজ কেস।
কনটেন্ট লেয়ারিং-এ এটাই গেম-চেঞ্জার।
👉 লিংক: donghaotian123.github.io/Wan-Alpha

8) HuMo AI (China) — আল্ট্রা-রিয়েল ফেস + মোশন ট্রান্সফার
এই টুলে টেক্সট/রেফারেন্স ইমেজ/অডিও মিশিয়ে হিউম্যান-লাইক ভিডিও বের হয়।
লিপ-সিঙ্ক ও ফেসিয়াল এক্সপ্রেশন ভিডিওজুড়ে কনসিস্টেন্ট থাকে।
টকিং-হেড, মিউজিক ডাব, সিন-রিপ্লে—সবখানে ইউজ কেস ক্লিয়ার।
মোশন-ট্রান্সফার দিয়ে অন্য কারো মুভমেন্টও কপি করা যায়।
👉 লিংক: phantom-video.github.io/HuMo

9) Qwen 3-Max — ফ্ল্যাগশিপ টেক্সট LLM, লং-কনটেক্সট + রিজনিং
দীর্ঘ কথোপকথন, প্ল্যানিং, টাস্ক-ব্রেকডাউন—সবখানে স্টেবল আউটপুট।
এজেন্টিক ওয়ার্কফ্লোতে চেইন-অফ-থট/টুল-ইউজে টিউনড।
রিসার্চ, রিপোর্ট, ডক-সমারি—প্রোড ইউজের ফিল।
ইকোসিস্টেমে আপডেটেড বেঞ্চমার্কও এসেছে।
👉 লিংক: qwen.ai/blog…87dc93f…

10) Qwen 3-Omni — টেক্সট+ইমেজ+অডিও+ভিডিও একসাথে
মাল্টিমডাল ইনপুট বুঝে কনসিস্টেন্ট আউটপুট দেয়।
ইমেজ প্রশ্ন, ভয়েস কমান্ড, ভিডিও কনটেক্সট—এক ফ্লোতে কাজ হয়।
রিয়েল-টাইম স্ট্রিমিং রেসপন্সে UX ফাস্ট ফিল করে।
মাল্টিল্যাঙ্গুয়েজে পারফর্ম্যান্সও স্ট্রং।
👉 লিংক: qwen.ai/blog…65f766f…

11) Qwen 3-VL — ভিশন-ল্যাঙ্গুয়েজ, ইমেজ-রিজনিং আপগ্রেড
ইমেজে অবজেক্ট/টেক্সট/লেআউট—সব মিলিয়ে প্রশ্নের ভালো উত্তর দেয়।
স্পেশাল রিজনিং, কাউন্টিং, রিলেশন—আগের চেয়ে অ্যাকিউরেট।
ডক-ভিশন, UI-অ্যানালাইসিস, চার্ট-রিডিং—প্র্যাক্টিকাল ইউজ কেস।
👉 লিংক: qwen.ai/blog…3c42801…

12) Qwen 3-Image Edit — ControlNet সহ ডিপ এডিটিং
ডেপথ/এজ/কী-পয়েন্ট কন্ডিশনে ফাইন কন্ট্রোল মিলে।
প্রোডাক্ট শট, ফেস এডিট, লোকাল টেক্সট-ইনপেইন্ট—সব সহজ।
আইডেন্টিটি কনসিস্টেন্সি ও রঙ/ম্যাটেরিয়াল স্টেবল।
👉 লিংক: qwen.ai/blog…7a90090…

13) Reve AI – Image edit like Nano Banana
নতুন এজেন্ট মোড নিয়ে এসেছে রিভ।Google Nano Banana এর মত।
কিন্তু কিছু কিছু জায়গায় Gemini 2.5 Flash এর চেয়েও ভালো কাজ করছে।
👉 লিংক: https://app.reve.com/home

14) “Nano-Banana” আপডেট (Gemini 2.5 Flash Image) — AR/Aspect Ratio
বহু অ্যাসপেক্ট রেশিও—21:9 থেকে 4:5—নেটিভ সাপোর্ট।
মাল্টি-ইমেজ ফিউশন, লোকাল এডিট, SynthID-ওয়াটারমার্ক অন।
ক্রিয়েটরদের জন্য ফরম্যাট-ফ্রিকশন অনেক কমে যায়।
👉 লিংক: developers.googleblog.com…aspect-ratios

15) [Hunyuan Image 3.0 — রিয়্যালিস্টিক টেক্সচার/লাইটিং]
ফটো-রিয়্যালিজম, শ্যাডো/ম্যাটেরিয়াল-ফিডেলিটি উন্নত।
চাইনিজ কনটেন্টে বেটার কনসিস্টেন্সি—ব্র্যান্ড/ই-কম শট-ফ্রেন্ডলি।
লো-নয়েজ/ক্লিনার ডিটেইলে সোশ্যাল-রেডি ইমেজ।
👉 লিংক: github.com/Tencent-Hunyuan/HunyuanImage-3.0

16) Kimi K2 Agent — স্মার্ট কম্পিউটার-অ্যাসিস্ট্যান্ট ভাইব
ফাইল অর্গানাইজ/ডক সার্চ/ওয়েব-অ্যাকশন—ওয়ার্কফ্লো-স্টাইল এক্সিকিউট।
MoE-ধাঁচের আর্কিটেকচারে বড় টাস্ক ভেঙে করে।
ডেস্কটপ-ইন্টিগ্রেশনের হিন্ট—প্রোডাক্টিভিটি বুস্ট।
👉 লিংক: kimi.com

17) [Suno v5 — প্রো/প্রীমিয়ার ইউজারদের জন্য আপগ্রেড]
টেক্সট-টু-মিউজিক/ভোকাল রিয়্যালিজমে উন্নতি।
কম ল্যাটেন্সি, স্টাইল-কন্ট্রোল, কপি-সেফটি টিউন।
শর্ট-ফর্ম সাউন্ড-বাইট/জিঙ্গল বানানো আরও ইজি।
👉 রেফ: Suno v5: https://help.suno.com/en/articles/8105153

18) [Kani-TTS — ১ সেকেন্ডে ~১৫ সেকেন্ড ভয়েস]
রিয়েল-টাইম ডাব/শর্ট-ভিডিও ন্যারেশন—টাইম সেভ হয়।
কোডেক-সিন্থেসিস ও টোকেন-জেনারেশনে স্পিড-আপ।
কোয়ালিটি-টু-লেটেন্সি রেশিও ভালো—লাইভ-ওয়ার্কফ্লোতে কাজে লাগে।
👉 লিংক: nineninesix.ai/n/kani-tts

19) [CAP4D — ছবি থেকে রিয়েল-টাইম 4D অ্যাভাটার]
সিঙ্গেল/মাল্টি-ফটো ইনপুট থেকে 4D মডেল ফিট করে।
রিয়েল-টাইম রেন্ডার/এক্সপ্রেশন কন্ট্রোল—স্ট্রিমিং-রেডি।
গেম, VTuber, ভার্চুয়াল-ইনফ্লুয়েন্সার—ডাইরেক্ট ইউজ কেস।
👉 লিংক: felixtaubner.github.io/cap4d

20) [Samsung “7M-Param” মডেল — ARC-AGI বেঞ্চমার্কে চমক]
মাত্র ৭ মিলিয়ন প্যারামিটারে রিকার্সিভ রিজনিং—“লেস ইজ মোর” ডেমো।
টিনি-নেটওয়ার্কে হাই-রিজনিং—ফিউচারের নতুন ডিরেকশন ইঙ্গিত।
কস্ট/কমপিউট কমিয়ে টেস্ট-অ্যান্ড-ডিপ্লয় পসিবল।
👉 লিংক (PDF): arxiv.org/pdf/2510.04871

21) [Apriel-1.5-15B (ServiceNow) — ছোট মডেল, বড় পারফরম্যান্স]
কম প্যারামিটারে রিজনিং/ইন্সট্রাকশন-ফলো উন্নত।
ইমেজ-রিজনিং/টেক্সট-রিজনিং—ব্যালান্সড রেজাল্ট।
এন্টারপ্রাইজ-অ্যাপ/অটোমেশন-চ্যাটে হালকা-ফাস্ট অপশন।
👉 লিংক: huggingface.co/ServiceNow-AI/Apriel-1.5-15b-Thinker

22) [Paper2Video — পেপার → স্লাইড/ভিডিও অটো-ক্রিয়েশন]
লং-ডক/পেপার থেকে কনসাইস স্লাইড/ভিডিও বানায়।
টেক্সট/ফিগার/টেবিল—স্টোরি-অর্ডারে সাজিয়ে দেয়।
রিসার্চ-কমিউনিকেট/ইউটিউব সামারি—হাই ভ্যালু ইউজ কেস।
👉 লিংক: showlab.github.io/Paper2Video
23) Qwen 3-Coder — কোড জেন/ডিবাগ, এজেন্টিক ওয়ার্কফ্লো
প্রম্পট দিলেই কমপ্লিট মডিউল/ফাইল জেনারেট করে।
ডিবাগ সাজেশন, টেস্ট, API স্টাব—ডেভ-ফ্লো স্পিড আপ।
CLI/টুলিং আছে; টিম-প্রজেক্টে দ্রুত প্রোটোটাইপিং।
👉 লিংক: github.com/QwenLM/Qwen3-Coder

24) [CodeMender (DeepMind) — কোড সিকিউরিটি এজেন্ট]
বাগ/ভালনারেবিলিটি খুঁজে অটো-প্যাচ সাজেস্ট/সাবমিট করতে পারে।
ফাজিং + স্ট্যাটিক অ্যানালাইসিস + LLM রিজনিং কম্বো ইউজড।
ওপেন-সোর্স রিপোজে বাস্তব ফিক্স ডেমো আছে।
👉 লিংক: deepmind.google…codemender…

25) [GLM 4.6 — কোডিং/মাল্টিল্যাঙ্গুয়েজ-রেডি LLM]
ডক্স/SDK-তে নতুন গাইড, IDE-ইন্টিগ্রেশনে ফ্লো স্মুথ।
কস্ট-এফিশিয়েন্ট সাবস্ক্রিপশন/টোকেন-পলিসি আপডেটেড।
কোড/চ্যাট—দুই ইউজ কেসে ব্যালান্সড পারফরম্যান্স।
👉 লিংক: docs.z.ai/guides/llm/glm-4.6

26) [Deep Robotics DR02 — ওয়াটারপ্রুফ হিউম্যানয়েড/ফিল্ড-রেডি]
বৃষ্টি/কাদা/পানিতে মুভ—IP-রেটেড বডি, আউটডোর-জব ফোকাস।
ইন্ডাস্ট্রি-গ্রেড ডেমোতে স্টেবিলিটি শো করা হয়েছে।
সিকিউরিটি/ইন্সপেকশন/সার্ভিস—প্র্যাক্টিকাল অ্যাপ্লিকেশন ক্লিয়ার।
👉 লিংক: youtu.be/e0cIZgkTn4M

27) [Figure 03 — সফট-ম্যাটেরিয়াল, হোম-ফার্স্ট রোবট]
গৃহস্থালি টাস্কে সেফ/ফ্লেক্সিবল মুভমেন্ট—হিউম্যান-ইন্টারঅ্যাকশন-ফ্রেন্ডলি।
হোম-অ্যাসিস্ট্যান্ট ডেমনস্ট্রেশন—ফিউচার ইউজ কেস ক্লিয়ার।
সফট-কন্ট্যাক্টে অ্যাক্সিডেন্ট-রিস্ক কমে।
👉 লিংক: youtu.be/Eu5mYMavctM

28) Ling-1T (Ant Group) — 1T-টোকেন, এফিশিয়েন্ট ট্রেনিং
বড় কর্পাস + অপ্টিমাইজড প্রিসিশনে স্পিড/মেমরি সেভিং।
চাইনিজ-সেন্ট্রিক ইউজ কেসে স্ট্রং ল্যাঙ্গুয়েজ কভারেজ।
রিসার্চ/এন্টারপ্রাইজ—দুই সাইডেই ইউজ কেস ওপেন।
👉 লিংক: huggingface.co/inclusionAI/Ling-1T


Discover more from PeeAI.com - Learn AI in Bangla

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *