ChatGPT-এর সর্বশেষ সংস্করণ রেডিওলজি বোর্ড-স্টাইল পরীক্ষায় উত্তীর্ণ হয়েছে, এআই-এর ‘ক্রমবর্ধমান সম্ভাবনা’ হাইলাইট করেছে, গবেষণায় দেখা গেছে
স্বাস্থ্য

ChatGPT-এর সর্বশেষ সংস্করণ রেডিওলজি বোর্ড-স্টাইল পরীক্ষায় উত্তীর্ণ হয়েছে, এআই-এর ‘ক্রমবর্ধমান সম্ভাবনা’ হাইলাইট করেছে, গবেষণায় দেখা গেছে

ChatGPT-এর সর্বশেষ সংস্করণ, OpenAI-এর কৃত্রিম বুদ্ধিমত্তার চ্যাটবট, একটি রেডিওলজি বোর্ড-স্টাইল পরীক্ষা পাস করার জন্য যথেষ্ট স্মার্ট, টরন্টো বিশ্ববিদ্যালয়ের একটি নতুন গবেষণায় দেখা গেছে।

GPT-4, যা আনুষ্ঠানিকভাবে 13 মার্চ, 2023 তারিখে চালু হয়েছিল, পরীক্ষার 150টি বহুনির্বাচনী প্রশ্নের 81% সঠিকভাবে উত্তর দিয়েছে৷

চ্যাটবটের উচ্চ নির্ভুলতা সত্ত্বেও, গবেষণাটি – রেডিওলজিতে প্রকাশিত, রেডিওলজিকাল সোসাইটি অফ নর্থ আমেরিকার (আরএসএনএ) একটি জার্নাল – এছাড়াও কিছু ভুল ত্রুটি সনাক্ত করেছে৷

চ্যাটজিপিটি ব্লাইন্ড স্টাডিতে প্রকৃত ডাক্তারদের চেয়ে ভালো চিকিৎসা পরামর্শ দিতে পাওয়া গেছে: ‘এটি একটি গেম চেঞ্জার হবে’

“একজন রেডিওলজিস্ট চিকিত্সার চিত্রগুলি ব্যাখ্যা করার সময় তিনটি জিনিস করেন: ফলাফলগুলি সন্ধান করা, ফলাফলগুলির অর্থ বোঝার জন্য উন্নত যুক্তি ব্যবহার করা এবং তারপরে সেই ফলাফলগুলি রোগীদের এবং অন্যান্য চিকিত্সকদের সাথে যোগাযোগ করা,” প্রধান লেখক রাজেশ ভায়ানা, এমডি, একজন পেটের রেডিওলজিস্ট ব্যাখ্যা করেছেন। এবং কানাডার টরন্টোতে ইউনিভার্সিটি মেডিকেল ইমেজিং টরন্টো, টরন্টো জেনারেল হাসপাতালের প্রযুক্তি নেতৃত্ব, ফক্স নিউজ ডিজিটালকে একটি বিবৃতিতে।

ChatGPT-এর সর্বশেষ সংস্করণ, OpenAI-এর কৃত্রিম বুদ্ধিমত্তার চ্যাটবট, একটি রেডিওলজি বোর্ড-স্টাইল পরীক্ষা পাস করার জন্য যথেষ্ট স্মার্ট, টরন্টো বিশ্ববিদ্যালয়ের একটি নতুন গবেষণায় দেখা গেছে। (আইস্টক)

“রেডিওলজিতে বেশিরভাগ AI গবেষণা কম্পিউটারের দৃষ্টিভঙ্গির উপর দৃষ্টি নিবদ্ধ করেছে, কিন্তু ChatGPT-এর মতো ভাষা মডেলগুলি মূলত ধাপ দুই এবং তিন (উন্নত যুক্তি এবং ভাষার কাজগুলি) সম্পাদন করছে,” তিনি বলেছিলেন।

“আমাদের গবেষণা একটি রেডিওলজি প্রসঙ্গে ChatGPT-এর কর্মক্ষমতা সম্পর্কে অন্তর্দৃষ্টি প্রদান করে, বৃহৎ ভাষার মডেলগুলির অবিশ্বাস্য সম্ভাবনাকে হাইলাইট করে, বর্তমান সীমাবদ্ধতাগুলি যা এটিকে অবিশ্বস্ত করে তোলে।”

স্বাস্থ্যসেবা প্রদানকারীদের জন্য চ্যাটজিপিটি: এআই চ্যাটবোট কি পেশাদারদের কাজকে আরও সহজ করে তুলতে পারে?

গবেষকরা এমনভাবে প্রশ্নগুলি তৈরি করেছেন যা কানাডিয়ান রয়্যাল কলেজ এবং আমেরিকান বোর্ড অফ রেডিওলজি পরীক্ষার শৈলী, বিষয়বস্তু এবং অসুবিধাকে প্রতিফলিত করেছে, মেডিকেল জার্নালে গবেষণার আলোচনা অনুসারে।

(কারণ ChatGPT এখনও ছবি গ্রহণ করে না, গবেষকরা পাঠ্য-ভিত্তিক প্রশ্নের মধ্যে সীমাবদ্ধ ছিলেন।)

প্রশ্নগুলি তখন ChatGPT-এর দুটি ভিন্ন সংস্করণে উত্থাপন করা হয়েছিল: GPT-3.5 এবং নতুন GPT-4।

উন্নত যুক্তিতে ‘চিহ্নিত উন্নতি’

ChatGPT-এর GPT-3.5 সংস্করণটি 69% প্রশ্নের সঠিক উত্তর দিয়েছে (150টির মধ্যে 104), কানাডার রয়্যাল কলেজ দ্বারা ব্যবহৃত 70% পাসিং গ্রেডের কাছাকাছি, গবেষণার ফলাফল অনুসারে।

এটি “উচ্চ ক্রম চিন্তা” সম্পর্কিত প্রশ্নগুলির সাথে সবচেয়ে বেশি লড়াই করেছে, যেমন ইমেজিং ফলাফলগুলি বর্ণনা করা।

রেডিওলজিস্ট

একটি নতুন গবেষণার প্রধান লেখক বলেছেন, “চিকিৎসা চিত্রের ব্যাখ্যা করার সময় একজন রেডিওলজিস্ট তিনটি জিনিস করছেন: ফলাফলের সন্ধান করা, ফলাফলের অর্থ বোঝার জন্য উন্নত যুক্তি ব্যবহার করা এবং তারপরে রোগীদের এবং অন্যান্য চিকিত্সকদের কাছে সেই ফলাফলগুলিকে যোগাযোগ করা,” বলেছেন একটি নতুন গবেষণার প্রধান লেখক (ছবিতে নয় ) (আইস্টক)

GPT-4 হিসাবে, এটি একই প্রশ্নের 81% (150 এর মধ্যে 121) সঠিকভাবে উত্তর দিয়েছে — 70% পাস করার থ্রেশহোল্ড অতিক্রম করেছে।

নতুন সংস্করণটি উচ্চ-ক্রম চিন্তাভাবনার প্রশ্নের উত্তর দেওয়ার ক্ষেত্রে অনেক ভালো করেছে।

“অধ্যয়নের উদ্দেশ্য ছিল ChatGPT কীভাবে রেডিওলজির প্রেক্ষাপটে পারফর্ম করে – উন্নত যুক্তি এবং মৌলিক জ্ঞান উভয় ক্ষেত্রেই,” ভায়ানা বলেন।

GPT-4 81% প্রশ্নের সঠিক উত্তর দিয়েছে, 70% পাস করার থ্রেশহোল্ড অতিক্রম করেছে।

“GPT-4 উভয় ক্ষেত্রেই খুব ভাল পারফর্ম করেছে, এবং রেডিওলজি-নির্দিষ্ট ভাষার প্রেক্ষাপটের উন্নত বোঝার প্রদর্শন করেছে – যা রেডিওলজি চিকিত্সকরা আরও দক্ষ এবং কার্যকর হতে ব্যবহার করতে পারে এমন আরও উন্নত সরঞ্জামগুলিকে সক্ষম করার জন্য গুরুত্বপূর্ণ,” তিনি যোগ করেছেন।

গবেষকরা GPT-4 এর GPT-3.5 এর তুলনায় উন্নত যুক্তি ক্ষমতায় “চিহ্নিত উন্নতি” দেখে অবাক হয়েছিলেন।

“আমাদের অনুসন্ধানগুলি রেডিওলজিতে এই মডেলগুলির ক্রমবর্ধমান সম্ভাবনাকে হাইলাইট করে, তবে ওষুধের অন্যান্য ক্ষেত্রেও,” ভায়ানা বলেছেন।

ব্রাজিলিয়ান ডাক্তার অসুস্থতা নির্ণয়ের জন্য AI ব্যবহার করেন

“আমাদের ফলাফলগুলি রেডিওলজিতে এই মডেলগুলির ক্রমবর্ধমান সম্ভাবনাকে হাইলাইট করে, তবে ওষুধের অন্যান্য ক্ষেত্রেও,” একটি নতুন গবেষণার প্রধান লেখক বলেছেন। (গেটি ইমেজের মাধ্যমে নেলসন অ্যালমেইডা/এএফপি)

ডাঃ হার্ভে কাস্ত্রো, ডালাস, টেক্সাস-ভিত্তিক বোর্ড-প্রত্যয়িত জরুরী ওষুধের চিকিত্সক এবং স্বাস্থ্য পরিচর্যায় কৃত্রিম বুদ্ধিমত্তা সম্পর্কিত জাতীয় স্পিকার, গবেষণায় জড়িত ছিলেন না তবে ফলাফলগুলি পর্যালোচনা করেছেন।

“GPT-3.5 থেকে GPT-4-এ পারফরম্যান্সের ঊর্ধ্বগতি একটি আরও বিস্তৃত প্রশিক্ষণ ডেটাসেট এবং মানব শক্তিবৃদ্ধি শেখার উপর জোর দেওয়ার জন্য দায়ী করা যেতে পারে,” তিনি ফক্স নিউজ ডিজিটালকে বলেছেন।

“এই বর্ধিত প্রশিক্ষণ GPT-4কে আরও কার্যকরভাবে ব্যাখ্যা করতে, বুঝতে এবং এমবেড করা জ্ঞানকে ব্যবহার করতে সক্ষম করে,” তিনি যোগ করেছেন।

চ্যাটজিপিটি এবং স্বাস্থ্যসেবা: এআই চ্যাটবোট কি রোগীর অভিজ্ঞতা পরিবর্তন করতে পারে?

একটি প্রমিত পরীক্ষায় উচ্চতর স্কোর পাওয়া, তবে, রেডিওলজির মতো মেডিকেল বিষয় সম্পর্কে আরও গভীর বোঝার সমান নয়, কাস্ত্রো উল্লেখ করেছেন।

“এটি দেখায় যে GPT-4 এটির উপর প্রশিক্ষিত বিপুল পরিমাণ তথ্যের উপর ভিত্তি করে প্যাটার্ন শনাক্তকরণে ভাল,” তিনি বলেছিলেন।

স্বাস্থ্য পরিচর্যায় ChatGPT এর ভবিষ্যত

ভায়ানা সহ অনেক স্বাস্থ্য প্রযুক্তি বিশেষজ্ঞরা বিশ্বাস করেন যে GPT-4 এর মতো বড় ভাষা মডেল (LLMs) সাধারণভাবে প্রযুক্তির সাথে মানুষের যোগাযোগের উপায় পরিবর্তন করবে – এবং আরও বিশেষভাবে ওষুধে।

“এগুলি ইতিমধ্যেই গুগলের মতো সার্চ ইঞ্জিন, এপিকের মতো ইলেকট্রনিক মেডিকেল রেকর্ড এবং নুয়েন্সের মতো মেডিকেল ডিকটেশন সফ্টওয়্যারে অন্তর্ভুক্ত করা হচ্ছে,” তিনি ফক্স নিউজ ডিজিটালকে বলেছেন৷

“কিন্তু এই সরঞ্জামগুলির আরও অনেক উন্নত অ্যাপ্লিকেশন রয়েছে যা স্বাস্থ্যসেবাকে আরও বেশি রূপান্তরিত করবে।”

অ্যাপ স্টোর ওয়েবসাইটে OpenAI ChatGPT অ্যাপ

“GPT-3.5 থেকে GPT-4-এ পারফরম্যান্সের ঊর্ধ্বগতি একটি আরও বিস্তৃত প্রশিক্ষণ ডেটাসেট এবং মানব শক্তিবৃদ্ধি শিক্ষার উপর বর্ধিত জোরের জন্য দায়ী করা যেতে পারে,” ডাঃ হার্ভে কাস্ত্রো, একজন বোর্ড-প্রত্যয়িত জরুরী চিকিত্সক এবং স্বাস্থ্যের ক্ষেত্রে AI এর জাতীয় স্পিকার যত্ন, ফক্স নিউজ ডিজিটাল বলেছেন. (জাকুব পোরজিকি/নূরফটো)

ভবিষ্যতে, ভায়ানা বিশ্বাস করে যে এই মডেলগুলি রোগীর প্রশ্নের সঠিক উত্তর দিতে পারে, চিকিত্সকদের রোগ নির্ণয় করতে এবং চিকিত্সার সিদ্ধান্ত নিতে সহায়তা করতে পারে।

রেডিওলজির প্রতি সম্মান জানিয়ে তিনি ভবিষ্যদ্বাণী করেছিলেন যে এলএলএম রেডিওলজিস্টদের দক্ষতা বৃদ্ধি করতে এবং তাদের আরও দক্ষ এবং কার্যকর করতে সাহায্য করতে পারে।

“আমরা এখনও পুরোপুরি সেখানে নেই – মডেলগুলি এখনও ক্লিনিকাল অনুশীলনের জন্য ব্যবহার করার জন্য যথেষ্ট নির্ভরযোগ্য নয় – তবে আমরা দ্রুত সঠিক দিকে এগিয়ে যাচ্ছি,” তিনি যোগ করেছেন।

মেডিসিনে ChatGPT এর সীমাবদ্ধতা

সম্ভবত রেডিওলজিতে এলএলএম-এর সবচেয়ে বড় সীমাবদ্ধতা হল ভিজ্যুয়াল ডেটা ব্যাখ্যা করতে তাদের অক্ষমতা, যা রেডিওলজির একটি গুরুত্বপূর্ণ দিক, কাস্ত্রো বলেন।

ChatGPT-এর মতো বৃহৎ ভাষার মডেলগুলি (LLMs) “হ্যালুসিনেট” করার প্রবণতার জন্যও পরিচিত, যা হল যখন তারা একটি আত্মবিশ্বাসী-শব্দপূর্ণ উপায়ে ভুল তথ্য প্রদান করে, ভায়ানা উল্লেখ করেছেন।

“মডেলগুলি এখনও ক্লিনিকাল অনুশীলনের জন্য যথেষ্ট নির্ভরযোগ্য নয়।”

“এই হ্যালুসিনেশনগুলি GPT-4-এ 3.5-এর তুলনায় হ্রাস পেয়েছে, কিন্তু এটি এখনও ক্লিনিকাল অনুশীলনে নির্ভর করার জন্য খুব ঘন ঘন ঘটে,” তিনি বলেছিলেন।

“চিকিৎসক এবং রোগীদের এই মডেলগুলির শক্তি এবং সীমাবদ্ধতা সম্পর্কে সচেতন হওয়া উচিত, এটি জানা সহ যে তারা বর্তমানে তথ্যের একমাত্র উত্স হিসাবে নির্ভর করা যায় না,” ভায়ানা যোগ করেছেন।

কম্পিউটারে ChatGPT

“চিকিৎসক এবং রোগীদের এই মডেলগুলির শক্তি এবং সীমাবদ্ধতা সম্পর্কে সচেতন হওয়া উচিত, এটি জেনে রাখা যে বর্তমানে তথ্যের একমাত্র উত্স হিসাবে তাদের উপর নির্ভর করা যায় না।” (গেটি ইমেজের মাধ্যমে ফ্র্যাঙ্ক রামপেনহর্স্ট/ছবি জোট)

কাস্ত্রো সম্মত হন যে এলএলএম-এর কাছে পরীক্ষায় উত্তীর্ণ হওয়ার পর্যাপ্ত জ্ঞান থাকতে পারে, তবে রোগীদের রোগ নির্ণয় এবং চিকিত্সা পরিকল্পনা তৈরি করার ক্ষেত্রে তারা মানব চিকিত্সকদের প্রতিদ্বন্দ্বিতা করতে পারে না।

“রেডিওলজি সহ মানসম্মত পরীক্ষাগুলি প্রায়শই ‘পাঠ্যপুস্তকের’ ক্ষেত্রে ফোকাস করে,” তিনি বলেছিলেন।

“কিন্তু ক্লিনিকাল অনুশীলনে, রোগীরা খুব কমই পাঠ্যপুস্তকের লক্ষণগুলির সাথে উপস্থিত হন।”

ফক্স নিউজ অ্যাপ পেতে এখানে ক্লিক করুন

প্রতিটি রোগীর অনন্য লক্ষণ, ইতিহাস এবং ব্যক্তিগত কারণ রয়েছে যা “স্ট্যান্ডার্ড” কেস থেকে আলাদা হতে পারে, কাস্ত্রো বলেছিলেন।

“এই জটিলতার জন্য প্রায়ই সূক্ষ্ম বিচার এবং সিদ্ধান্ত নেওয়ার প্রয়োজন হয়, এমন একটি ক্ষমতা যা AI – GPT-4 এর মতো উন্নত মডেল সহ – বর্তমানে নেই।”

আমাদের স্বাস্থ্য নিউজলেটারের জন্য সাইন আপ করতে এখানে ক্লিক করুন

GPT-4-এর উন্নত স্কোরগুলি প্রতিশ্রুতিবদ্ধ হলেও, কাস্ত্রো বলেন, “এআই সরঞ্জামগুলি একটি বাস্তব-বিশ্ব ক্লিনিকাল সেটিংয়ে সঠিক, নিরাপদ এবং মূল্যবান তা নিশ্চিত করার জন্য অনেক কাজ করতে হবে।”

মেলিসা রুডি স্বাস্থ্য সম্পাদক এবং ফক্স নিউজ ডিজিটালের লাইফস্টাইল দলের সদস্য।

Source link

Related posts

জাহাজের বিস্ময়কর স্বাস্থ্য পরিদর্শন ব্যর্থ হওয়ার পরে ক্রুজ জাহাজের উদ্বেগজনক অবস্থার প্রকাশ

News Desk

ইউরোলজি কি? ইউরোলজি বিশেষজ্ঞ ডাক্তার তালিকা

News Desk

আইওয়ার 6-সপ্তাহের গর্ভপাতের নিষেধাজ্ঞা আইনে স্বাক্ষরিত হয়েছে, কিন্তু আইনি চ্যালেঞ্জের সম্মুখীন হয়েছে

News Desk

Leave a Comment