עקבו
פודקאסט מלחמות ה-AI

בלוג

פודקאסט מלחמות ה-AI

BLOG

מלחמות ה-AI – פרק 3 עדכונים חשובים

ברוכים השבים לפרק השלישי של מלחמות ה-AI

הכרזה על חידושים ב- OpenAI

OpenAI הודיעה ב-6 ליולי על פתיחת הגישה של CHAT GPT 4 המודל הכי עדכני שלה לייצור טקסט, לכל המפתחים באמצעות API.

כעת כל המפתחים יכולים באמצעות ה- API של  לגשת לטכנולוגיתGPT-4. החברה מתכננת לפתוח גישה למפתחים חדשים עד סוף החודש, ואז להתחיל להעלות את מגבלות הזמינות לאחר מכן “בהתאם לזמינות השירות”.

“מיליוני מפתחים ביקשו גישה לממשק ה- API של GPT-4 מאז מרץ, ומגוון המוצרים החדשניים הממנפים את GPT-4 גדל מדי יום”, כתב OpenAI בפוסט בבלוג. “אנו מדמיינים עתיד שבו מודלים מבוססי צ’אט יכולים לתמוך בכל מקרה שימוש.”

מה זה אסימונים – TOKENS בהקשר של Context window (חלון הקשר)?

אסימונים בהקשר של בינה מלאכותית הם יכולת הזיכרון של המכונה לנתח מידע קיים לפני שהיא מחזירה תשובה או יוצרת משהו.

למה זה חשוב? GPT-4  החזיק בכתר עד לא מזמן עם 32,000 אסימונים בקצה. באופן כללי, מודלים עם מעט אסימונים נוטים “לשכוח” את התוכן של השיחות העדכניות שלהן, מה שמוביל אותם לסטות מהנושא.

מאז חשיפת ה- GPT-4 במרץ 23, מלחמות ה- AI היוצר הלכו והתעצמו. לאחרונה הרחיבה אנתרופיק (Anthropic) את האסימונים של מודל קלאוד (Claude) – מודל הדגל שלה ליצירת טקסט מ -9,000 אסימונים ל -100,000 אסימונים. (חלון ההקשר (Context window) מתייחס לטקסט שהמודל שוקל לפני יצירת טקסט נוסף)

בהודעה שלה, OpenAI הכריזה שהיא הופכת את ממשקי ה- API של DALL-E 2 ו- Whisper לזמינים לכולם. DALL-E 2 הוא המודל ליצירת תמונות של OpenAI ו-WHISPER הוא מודל הפיכת הדיבור לטקסט (תמלול) של החברה. החברה גם אמרה כי היא מתכננת להוציא מכלל שימוש מודלים ישנים הזמינים באמצעות ה- API שלה כדי “לייעל את יכולת המחשוב שלה”. (במהלך החודשים האחרונים, בעיקר הודות לפופולריות המתפוצצת של ChatGPT, OpenAI נאבקה לעמוד בקצב הביקוש לדגמים הגנרטיביים שלה.)

החל מה -4 בינואר 2024, מודלים של OpenAI ישנים יותר – במיוחד GPT-3 ונגזרותיו – כבר לא יהיו זמינים, ויוחלפו בדגמי “בסיס GPT-3”  חדשים שאפשר להניח שהם יעילים יותר לחישוב – מפתחים שמשתמשים במודלים הישנים יצטרכו להחליף לחדשים.

גוגל מציגה את Gemini  המודל פורץ הדרך שאמור לעלות ביכולתיו על ChatGPT

מבוסס על מודל וטכניקה שנראת AlphaGo לפתרון בעיות, המודל הרבה יותר יעיל, אפקטיבי ומתקדם (לפחות על פי מקורות שקראתי), הטכנולוגיה הזאת אמורה להיות מסוגלת לאפשר לבינה מלאכותית יוצרת לייצר תוכן מאוד מאוד מדויק ולא לחרוג, להגזים והמציא שטויות, בביצוע נכון, הטכנולוגיה כזאת יכולה לערער משמעותית את הדומיננטיות של כלים הקיימים.

בנוסף הטכנולוגיה החדשה של גוגל מדגישה ומשפרת בפני המודל יכולות של מיצוי משאבים לטובת השלמת המשימה על הצד הטוב ביותר ולמידה על ידי פידבק שמתקבל.

ג’מיני עוד נמצאת בפיתוח אבל אם הכל ילך כמתוכנן אנחנו עוד צפויים לשמוע עליה בעתיד.  חשוב לציין שג’מיני כרגע עוסק אך ורק ביצירת טקסט, לא מדיה לא קול ולא שום דבר אחר אבל צפוי להיות אפילו יותר יצירתי מgpt4.

לסיכום הנושא, כרגע גוגל בהחלט מסתרחת מאחור כאשר המתחרות משאירות לה אבק, יש ציפייה ענקית של השוק והמשקיעים לראות את גוגל פורצת דרך אבל בינתיים למעט כותרות פה ושם בידיוק כמו זאת שדיברנו עליה היום היא מתקשה לשחרר לשוק פתרון אמיתי. עם זאת, גוגל זו חברה שאסור בשום פנים ואופן לזלזל בה, מדובר באחת מהחברות העמידות והחזקות בעולם, גוגל בין אם במכוון או שלא קובעת את סדר היום העולמי בכל מקום שיש בו אינטרנט, גוגל קובעת מי קיים ומי לא קיים במרחב הדיגיטלי, הכל לכאורה כמובן אבל כמות המידע שגוגל אוספת מ-1998 ועד היום נותן לה יתרון עצום בתחום ה-AI.

גיימצנגר בעולם יצירת התמונות !

MIDJOURNEY משיקה יכולת להרחיב תמונה מעבר למסגרת שלה לכל כיוון שתבקשו. במסגרת הפיצר החדש אפשר להרחיב תמונה באופן כללי או לצד מסוים, מידגרני הינו הכי המתקדם בעולם ליצירת תמונות והפיצר החדש נותן עוד כוח ענק למתחרים לעצב את התוצרים שלהם ולהרחיב אותם לגבולות חדשים.

המשמעות של הפיצר החדש זה שמשתמשים עכשיו יכולים ליצור תמונות פנורמיות ולהשתמש בהם למגוון שימושים וברמה העסקית מידגקרני עכשיו מצמצמת כמה פערים משמעותיים שהיו לה מול המתחרה, כלי ה- DALL E של חברת OPENAI צ’אט GPT.

משתמשים דיווחו שעד כה הם  היו משתמשים בתמו נות שנוצרו על ידי מידגרני ומרחיבים אותן בdalle2  ועכשיו ניתן לעשות את זה ישירות במידגרני, שימו לב לדומיננטיות של הכלי המדהים הזה.

מלחמות ה-AI - פרק 3 עדכונים חשובים

ולקינוח: הבינה המלאכותית בסין

אז בואו נדבר רגע על האמירה של אלון מאסק אתמול: “לסין יהיה בינה מלאכותית עוצמתית ביותר” או במילים אחרות סין עשויה לשלוט בתחום הרבה לפני שנביןם מה קורה. עכשיו בנימה אישית, אני מפציר בכל להפסיק לראות את כל העולם בעיניים מערביות: כמה כוח ומידע יש לגוגל? כל המידע באינטרנט נו יופי ולאפל? ולפייסבוק? ועל כמה אנשים מאות מיליונים באופן קבוע ואולי עוד כמה מאות מיליונים באופן ספונטני?

תחשבו כמה ידע ומידע יש לסין, לגוגל, אפל, מייקרוסופט או פייסבוק אין מצלמות בכל פינה ברחוב ובכל משרד, אין מערך מודיעיני פנימי לכאורה שיודע מה עושה ומה אומר כל אזרח, בתמונה הגדולה לסין יש הכל ואם אין לה משהו זה לרוב מתאפשר בהוראה אחת, חוץ מטכנולוגית קריאת מחשבות כנראה יש להם הכל תדמיינו כמה כוח ומידע יש להם עם מיליארד 400 מיליון אזרחים בתוך המדינה!!

ועכשיו לעדכון הטכנולוגי: ב-7 ליולי הציגו עליבאבא באמצעות חברת הבת שלה עליבאבא קלאוד וחברת הו-וואוי מודלי בינה מלאכותית יוצרת כולל ייצור טקסטים תמונות ומדיה אחרת. כרגע רוב הטכנולוגיות נמצאות בשלב בטא, יש במזרח דיסור על”מפץ ה-AI” שיצרה OPEN כשהשיקה את GPT. החברות הסיניות מנסות להדביק את הפער ולהשיק בשנה הקרובה מוצרים עצמאיים משלהם.

דווח שהחברות נמצאות במירוץ חימוש תעשייתי מהאגרסיביים אי פעם, ניתן רק לנחש שממשלת סין עוזרת להם ברקע, לכל אחת מהמדינות יש אינטרס לבסס שליטה בתחום הבינה המלאכותית.

חברת הייעוץ מקינזי מעריכה שבינה מלאכותית יוצרת יכולה להגדיל את הכלכלה ב7.3 טריליון דולר בממוצע!!

בפרק הקודם הזכרתי את המוצר החדש של עליבאבא: Tongyi Qianwen, אמור לתת פייט לchatgpt והמוצר שלהם ליצירת תמונות TongyiWanxiang ייתן תוכן למידגרני וdalle.

כמו כן עליבאבא כבר השיקה מוצר למתחים שנקרא ModelScopeGPT

לעומת החברות שהכזרנו היום הוו-וואי כבר הצהירה שהיא נוקטת בגישה אחרת לחלוטין ולא מפתחת מוצרים לשימוש פרטי, המודל שלה Pangu 3.0 יתן שירות בעיקר לתעשייות, התעשיות שעל הכוונת הן תעשיות אבטחה, הובלות כבדות ורכבות, תמיכה מבוססת AI לממשלות ועיריות וחיזוי מזג אוויר.

פתאום יצירת תמונות נשמע לא משמעותי בכלל אה?

לסיכום מלחמת ה-AI עולה מדרגה כל יום נכנסים עוד ועוד שחקנים למגרש הזה וצפויים לנו עוד פרקים מרתקים, תודה שהייתם איתי מקווה שנהנתם וכמובן מוזמנים להפיץ לחברים.

מלחמות ה-AI – פרק 3 עדכונים חשובים

מאמרים נוספים