ওপেনএআই-এর চ্যাটজিপিটি সব ধরনের প্রশ্নের দ্রুত উত্তর দেওয়ার জন্য জনপ্রিয় হয়ে উঠেছে – কিন্তু JAMA অনকোলজিতে একটি নতুন গবেষণায় পরামর্শ দেওয়া হয়েছে যে কৃত্রিম বুদ্ধিমত্তার চ্যাটবটের কিছু গুরুতর ত্রুটি থাকতে পারে যখন এটি ক্যান্সারের চিকিৎসার জন্য চিকিৎসা পরামর্শের জন্য আসে।
ম্যাস জেনারেল ব্রিঘাম, স্লোন কেটারিং এবং বোস্টন চিলড্রেন’স হাসপাতালের গবেষকরা 104টি বিভিন্ন প্রম্পট সংকলন করে এবং চ্যাটবটকে ক্যান্সারের চিকিৎসার জন্য সুপারিশের জন্য জিজ্ঞাসা করে ChatGPT পরীক্ষা করে।
এরপরে, তাদের চারটি বোর্ড-প্রত্যয়িত অনকোলজিস্টদের একটি দল ছিল পাঁচটি মানদণ্ড ব্যবহার করে পর্যালোচনা এবং প্রতিক্রিয়াগুলি স্কোর করে।
সামগ্রিকভাবে, ChatGPT একটি অপ্রতিরোধ্য 61.9% স্কোর করেছে।
আর্টিফিসিয়াল ইন্টেলিজেন্স কি?
যদিও ল্যাঙ্গুয়েজ লার্নিং মডেল (LLMs) সফলভাবে ইউএস মেডিকেল লাইসেন্সিং পরীক্ষায় উত্তীর্ণ হয়েছে, চ্যাটবট যখন ন্যাশনাল কম্প্রিহেনসিভ ক্যান্সার নেটওয়ার্ক (NCCN) নির্দেশিকাগুলির সাথে সামঞ্জস্যপূর্ণ সঠিক ক্যান্সার চিকিৎসার সুপারিশ প্রদানের ক্ষেত্রে কম পারফর্ম করেছে।
অনেক ক্ষেত্রে, প্রতিক্রিয়াগুলি অস্পষ্ট বা মিশ্রিত ভুল এবং সঠিক তথ্য ছিল।
JAMA অনকোলজির একটি নতুন গবেষণায় পরামর্শ দেওয়া হয়েছে যে কৃত্রিম বুদ্ধিমত্তার চ্যাটবটটিতে কিছু গুরুতর ত্রুটি থাকতে পারে যখন এটি ক্যান্সারের চিকিৎসার জন্য চিকিৎসা পরামর্শ দেওয়ার ক্ষেত্রে আসে। (iStock)
প্রায় 13% প্রতিক্রিয়া “হ্যালুসিনেটেড” ছিল, যার অর্থ তারা বাস্তবসম্মত বলে মনে হতে পারে, কিন্তু গবেষকদের ফলাফল অনুসারে সম্পূর্ণ ভুল বা প্রম্পটের সাথে সম্পর্কহীন ছিল।
“এটি একটি উল্লেখযোগ্য উদ্বেগ, কারণ এটি ভুল তথ্য এবং সম্ভাব্য ক্ষতিকারক রোগীর সিদ্ধান্তের দিকে নিয়ে যেতে পারে,” বলেছেন ডাঃ হার্ভে কাস্ত্রো, টেক্সাসের কপেলের একজন জরুরী চিকিৎসা চিকিৎসক এবং এআই বিশেষজ্ঞ।
নতুন এআই টেকের লক্ষ্য হল সর্বোত্তম চিকিৎসার জন্য ক্যান্সারের উৎপত্তি শনাক্ত করা: ‘একটি গুরুত্বপূর্ণ পদক্ষেপ’
কাস্ত্রো গবেষণায় জড়িত ছিলেন না তবে ফলাফলের উপর মন্তব্য করেছিলেন।
“উদাহরণস্বরূপ, উন্নত ফুসফুসের ক্যান্সারে আক্রান্ত একজন রোগী এনসিসিএন নির্দেশিকা দ্বারা স্বীকৃত নয় এমন চিকিত্সার জন্য সুপারিশ পেতে পারে, যা উপযুক্ত যত্ন গ্রহণে বিলম্ব ঘটাতে পারে।”
হার্ভার্ড মেডিকেল স্কুলের রেডিয়েশন অনকোলজির অধ্যয়নের সহ-লেখক এবং সহকারী অধ্যাপক ড্যানিয়েল বিটারম্যান বলেছেন যে সামগ্রিকভাবে, ফলাফলগুলি প্রত্যাশা পূরণ করেছে।
তিনটি ভিন্ন হাসপাতাল সিস্টেমের গবেষকরা 104টি ভিন্ন প্রম্পট কম্পাইল করে চ্যাটজিপিটি পরীক্ষা করেছেন – এবং চ্যাটবটকে ক্যান্সারের চিকিৎসার জন্য সুপারিশের জন্য জিজ্ঞাসা করেছেন। ফলাফল অপ্রতিরোধ্য ছিল. (আইস্টক/গেটি)
তিনি ফক্স নিউজ ডিজিটালকে বলেন, “ChatGPT এবং একই ধরনের অনেক বড় ভাষার মডেলকে প্রাথমিকভাবে চ্যাটবট হিসেবে কাজ করার জন্য প্রশিক্ষিত করা হয়, কিন্তু তারা নির্ভরযোগ্যভাবে সঠিক তথ্য প্রদানের জন্য বিশেষভাবে প্রশিক্ষিত নয়।”
“আমাদের ফলাফলগুলি দেখিয়েছে যে মডেলটি সাবলীলভাবে কথা বলতে এবং মানুষের ভাষা অনুকরণ করতে ভাল,” তিনি উল্লেখ করেছেন। “কিন্তু স্বাস্থ্য পরামর্শের জন্য একটি চ্যালেঞ্জিং দিক হল যে এটি সঠিক বনাম ভুল তথ্য সনাক্ত করা কঠিন করে তোলে।”
AI চ্যাটবোটের লক্ষ্য হল প্রসবোত্তর বিষণ্নতায় আক্রান্ত মহিলাদের জন্য সহায়তা প্রদান করা: ‘একটি হাতিয়ার, প্রতিস্থাপন নয়’
তিনি আরও বলেন, “প্রতিক্রিয়াগুলি পড়ার সময়, আমি কীভাবে সঠিক চিকিত্সার বিকল্পগুলি ভুলগুলির সাথে নির্বিঘ্নে মিশ্রিত হয়েছিল তা দেখে আমি অবাক হয়েছিলাম৷ এছাড়াও, আমি উত্সাহিত হয়েছিলাম যে প্রায় সমস্ত প্রতিক্রিয়াগুলিতে কিছু সঠিক তথ্য রয়েছে – এটি মডেলগুলির যোগাযোগের ভবিষ্যতের সম্ভাবনা দেখায়৷ চিকিত্সক ইনপুটের সহযোগিতায় তথ্য, এমনকি যদি আমরা এখনও সেখানে না থাকি, “তিনি যোগ করেছেন।
স্টাডি সীমাবদ্ধতা
গবেষণার মূল সীমাবদ্ধতা ছিল যে গবেষকরা একটি “সময়ের স্ন্যাপশটে” শুধুমাত্র একটি এলএলএম মূল্যায়ন করেছেন; কিন্তু তারা বিশ্বাস করে যে ফলাফলগুলি বৈধ উদ্বেগ এবং ভবিষ্যতের গবেষণার প্রয়োজনীয়তা তুলে ধরে।
এই গবেষণার জন্য ChatGPT 3.5 ব্যবহার করা হয়েছিল, কিন্তু ওপেনএআই একটি নতুন মডেল, GPT 4 প্রকাশ করেছে, গবেষণা শেষ হওয়ার পরে।
চারটি বোর্ড-প্রত্যয়িত অনকোলজিস্টদের একটি দল পাঁচটি মানদণ্ড ব্যবহার করে প্রতিক্রিয়া পর্যালোচনা করেছে এবং স্কোর করেছে। সামগ্রিকভাবে, ChatGPT মাত্র 61.9% স্কোর করেছে। (iStock)
“তবুও, আমরা যে মডেলটি পরীক্ষা করেছি তা হল সর্বজনীনভাবে উপলব্ধ এবং রোগীদের ব্যাপক জনসংখ্যার দ্বারা সর্বাধিক অ্যাক্সেসযোগ্য,” বিটারম্যান বলেছিলেন।
গবেষকরা প্রম্পট ইঞ্জিনিয়ারিংয়ের নিবিড় তদন্তও করেননি, যার ফলাফল উন্নত হতে পারে, তিনি যোগ করেছেন।
একজন ডাক্তারকে জিজ্ঞাসা করুন: একজন বিশেষজ্ঞের দ্বারা উত্তর দেওয়া এআই এবং স্বাস্থ্য যত্ন সম্পর্কে 25টি জ্বলন্ত প্রশ্ন
“পরিবর্তে, আমরা জনসংখ্যার একজন সাধারণ সদস্যের দৃষ্টিকোণ থেকে আমাদের প্রম্পট (প্রশ্ন) ডিজাইন করেছি যা ক্যান্সারের চিকিত্সা সম্পর্কে সাধারণ প্রশ্ন জিজ্ঞাসা করে।”
এছাড়াও, গবেষণায় ক্যান্সার চিকিৎসার সুপারিশ প্রদানের জন্য এআই চ্যাটবট ব্যবহারের নৈতিক বিবেচনার বিষয়ে আলোচনা করা হয়নি, উল্লেখ করেছেন ড. কাস্ত্রো।
“যদিও এআই চ্যাটবটগুলি একটি মূল্যবান হাতিয়ার হতে পারে, পেশাদার চিকিৎসা পরামর্শের জন্য তাদের একটি পরিপূরক হিসাবে ব্যবহার করা উচিত, প্রতিস্থাপন নয়।”
“এই প্রসঙ্গে এআই চ্যাটবটগুলি ব্যবহার করার সম্ভাব্য ঝুঁকি এবং সুবিধাগুলি বিবেচনা করা গুরুত্বপূর্ণ এবং রোগীরা যাতে সঠিক এবং উপযুক্ত সুপারিশগুলি পান তা নিশ্চিত করার জন্য সুরক্ষা ব্যবস্থা থাকা গুরুত্বপূর্ণ,” তিনি ফক্স নিউজ ডিজিটালকে বলেছেন৷
ক্যাস্ট্রো বলেছিলেন যে তিনি ক্যান্সারের চিকিত্সার তথ্য প্রদানের জন্য এআই চ্যাটবট ব্যবহারের প্রতিশ্রুতি দেখেন – তবে উল্লেখযোগ্য চ্যালেঞ্জগুলি এখনও সমাধান করা দরকার।
“চিকিৎসার সুপারিশ করার সময় সতর্ক থাকা এবং প্রতিষ্ঠিত নির্দেশিকা এবং ক্লিনিকাল দক্ষতার উপর নির্ভর করা গুরুত্বপূর্ণ,” পেশাদার চিকিৎসা পরামর্শের ক্ষেত্রে এআই চ্যাটবট ব্যবহারের প্রসঙ্গে ডাঃ হার্ভে কাস্ত্রো (ছবিতে নেই) বলেছেন। (iStock)
“যদিও এআই চ্যাটবটগুলি একটি মূল্যবান হাতিয়ার হতে পারে, তবে পেশাদার চিকিৎসা পরামর্শের জন্য তাদের একটি পরিপূরক হিসাবে ব্যবহার করা উচিত, প্রতিস্থাপন নয়,” তিনি বলেছিলেন।
“একজন চিকিত্সক হিসাবে, চিকিত্সার সুপারিশ করার সময় সতর্ক থাকা এবং প্রতিষ্ঠিত নির্দেশিকা এবং ক্লিনিকাল দক্ষতার উপর নির্ভর করা গুরুত্বপূর্ণ,” কাস্ত্রো বলেছিলেন।
“যদি আমরা এটি ভুল করি তবে অনেক কিছু ঝুঁকির মধ্যে রয়েছে।”
“ভবিষ্যত গবেষণা অবশ্যই এআই চ্যাটবটগুলির দীর্ঘমেয়াদী প্রভাব এবং ক্যান্সারের চিকিত্সা এবং রোগীর স্ব-শিক্ষায় সাধারণীকরণের মূল্যায়ন করবে।”
নতুন এআই ‘ক্যান্সার চ্যাটবট’ রোগী এবং পরিবারকে 24/7 সহায়তা প্রদান করে: ‘সহানুভূতিশীল দৃষ্টিভঙ্গি’
এছাড়াও, ক্যাস্ট্রো ভবিষ্যতের অধ্যয়নগুলি আরও ধরণের ক্যান্সারের মূল্যায়ন দেখতে চান।
“অধ্যয়নটি স্তন, প্রোস্টেট এবং ফুসফুসের ক্যান্সারের চিকিত্সার সুপারিশ প্রদানে চ্যাটবটের কার্যকারিতা মূল্যায়ন করেছে,” তিনি উল্লেখ করেছেন। “অন্যান্য ধরনের ক্যান্সার বা অন্যান্য চিকিৎসা অবস্থার পরামর্শ দেওয়ার ক্ষেত্রে চ্যাটবট কীভাবে কাজ করবে তা অজানা।”
যদিও ChatGPT-এর মতো সাধারণ মডেলগুলিকে চিকিৎসা পরামর্শ দেওয়ার জন্য প্রশিক্ষিত করা হয় না — এবং তথ্যের গুণমান “ঔষধের জন্য দণ্ড পূরণ করে না” — বিটারম্যান বলেছিলেন যে তারা অ্যাক্সেসযোগ্য ভাষায় তথ্য সংশ্লেষণ করার সম্ভাবনা দেখায়।
“স্বাস্থ্য পরিচর্যায় AI এর অনেক উত্তেজনা এবং সম্ভাবনা রয়েছে, তবে আমাদের প্রতিটি ধাপে আমাদের মডেলগুলিকে যত্ন সহকারে মূল্যায়ন করতে হবে এবং উচ্চ-স্টেকের ক্লিনিকাল ডোমেনের জন্য তাদের অপ্টিমাইজ করতে হবে,” তিনি ফক্স নিউজ ডিজিটালকে বলেছেন।
আমাদের স্বাস্থ্য নিউজলেটারের জন্য সাইন আপ করতে এখানে ক্লিক করুন
ওষুধ এবং যত্নের মান ক্রমাগত বিকশিত হওয়ার সাথে সাথে, বিটারম্যান উল্লেখ করেছেন যে যদি ক্লিনিকাল ব্যবহারের জন্য একটি মডেল তৈরি করা হয় তবে এটিকে আপ-টু-ডেট নির্দেশিকা প্রদান করতে হবে।
“এর জন্য প্রয়োজন হবে যে ডেভেলপাররা মডেলগুলিকে কোন ডেটাতে প্রশিক্ষণ দেওয়া হয়েছিল সে সম্পর্কে স্বচ্ছতা প্রদান করবে এবং সময়ের সাথে সাথে তাদের কার্যকারিতা পুনঃমূল্যায়ন করবে,” তিনি বলেছিলেন।
ফক্স নিউজ অ্যাপ পেতে এখানে ক্লিক করুন
“আমরা যদি এটি ভুল করি তবে অনেক কিছু ঝুঁকির মধ্যে রয়েছে – এবং রোগীর নিরাপত্তা সর্বাগ্রে,” বিটারম্যান যোগ করেছেন।
“যদি পর্যাপ্ত পরীক্ষা ছাড়াই তাড়াহুড়ো করার কারণে প্রাথমিক ত্রুটি হয়, তবে এটি শেষ পর্যন্ত ক্ষেত্রটিকে আবার সেট করতে পারে এবং সম্ভাব্য লাভকে ধীর করে দিতে পারে।”
মেলিসা রুডি স্বাস্থ্য সম্পাদক এবং ফক্স নিউজ ডিজিটালের লাইফস্টাইল দলের সদস্য।