کاربردکاوی وب به استخراج الگوهایی بامعنی از دادههای تولید شده در تعامل بین کلاینت و سرورهای وب می پردازد. این نوع کاوش بر تکنیکهایی تمرکز دارد که رفتار کاربر را در زمان تعامل با وب پیش بینی می کند. دادهای که در این نوع کاوش مورد استفاده قرار میگیرد، دادههایی است که در نتیجه تعامل کاربران با وب ایجاد و نگهداری شده اند. کاربردهای این نوع کاوش، معمولا شامل خصوصیسازی وب، ایجاد سایتهای وب تطبیقی، مدل سازی کاربر، … میباشد[۵۴,۴۱].
در سال های اخیر تحقیقات وسیعی در زمینه کاربردکاوی وب انجام شدهاست. در این بخش ابتدا انواع داده ای که در این شاخه از وب کاوی استفاده می شود، معرقی می شوند. سپس تکنیک هایی که برای پیش پردازش و جداسازی دادههای جمعآوری شده به کار میروند، بررسی میشوند. همچنین تکنیکهای کاوش و کاربردهای کاربردکاوی وب تشریح می گردند[۵۴].
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
۲-۷-۳-۱ فازهای کاربرد کاوی وب
فازهای کاربرد کاوی وب را در جدول ۲-۴ به تصویر کشیده شدهاست[۵۴,۴۱].
جدول۲-۴.فاز های کاربردکاوی وب[۵۴,۴۱]
پیش پردازش
اولین روش برای بازیابی داده ی خام از منابع وب و پردازش دادهها بر اساس مشتری، سرور و پروکسی سرور است. و به طور خودکار به دادههای خام اصلی تبدیل شدهاست و شامل چهار مرحله پاکسازی داده، تشخیص و بازسازی نشست های کاربران، بازیابی اطلاعات مربوط به محتوا و ساختار صفحه و قالب بندی داده میشود.
کشف الگو
بر اساس پردازش دادهها، دانش و پیاده سازی تکنیک هارا کشف میکند برای کشف دانش از یادگیری ماشین و روشهای داده کاوی استفاده میکند.
تجزیه و تحلیل الگو
تجزیه و تحلیل الگوی فرایند پس از کشف الگو است . آن الگویی که در وب صحیح است را چک میکندو چگونگی پیاده سازی در وب برای استخراج اطلاعات را درجستجو وب به شما می گوید در واقع استخراج دانش از وب است.
۲-۷-۳-۲ انواع دادههای کاربردکاوی وب
دادههای کاربرد کاوی وب[۳۶] مشخصات کاربران و رفتار پیمایش آنها در سایت های وب را مشخص می نمایدکه انواع آن درشکل ۲-۱۰ نشان داده شدهاست[۵۴,۲۹].
.
شکل ۲-۱۰.دادههای کاربرد کاوی وب[۵۴,۲۹]
سرورهای وب غنیترین و رایجترین منبع دادههای استفاده از وب هستند. آنها دادهها را در فایل های ثبت[۳۷] خود و فایل های ثبت پایگاه دادههایی که استفاده می کنند، ذخیره می نمایند. دادههای سرورهای وب، معمولا شامل آدرس های IP، زمان و تاریخ دستیابی ها و … می باشند و معمولا در قالب های استاندارد مانند Common Log Format، Extended Log Format، LogML، … بازنمایی می شوند[۵۴,۲۹].
یک چالش اصلی در استفاده از سرورهای وب، تشخیص نشست[۳۸] های کاربر (دسته بندی تقاضاهای کاربر به گونه ای که مسیر پیمایش وی در سایت مشخص شود) می باشد. نحوه انجام این کار به نوع دادههایی که در فایل های ثبت ذخیره می شود، بستگی دارد. رایج ترین روش برای تشخیص نشست های کاربر، استفاده از Cookie ها می باشد[۵۴,۲۹].
به غیر از فایل های ثبت، می توان از شنود[۳۹] بسته های TCP/IP برای ردیابی رفتار کاربران استفاده کرد. همچنین برخی از سرورهای برنامه های کاربردی، تعاملات کاربران با سرور را ردیابی کرده و آنها را در فایل های ثبت سرور نگهداری می کنند. به طور کلی در صورت ذخیره دادهها در سمت سرور، یک تصویر کلی از چگونگی استفاده شدن یک سرویس توسط تمام کاربران وجود دارد[۵۴,۲۹].
جمع آوری دادههای سرورهای پراکسی مربوط به پیمایش کاربران در سرورهای پراکسی مشابه جمع آوری دادهها در سرورهای وب است. تفاوت اصلی در اینجا آن است که سرورهای پراکسی دادههای گروه هایی از کاربران را که به تعداد زیادی از سرورهای وب مراجعه می کنند، جمع آوری می کنند. در این حالت نیز تشخیص نشست های کاربران مشکل است و نمی توان کلیه مسیرهای پیمایش کاربران را تشخیص داد.
دادههای کلاینت به این صورت است که دادههای استفاده از وب را می توان با بهره گرفتن از اسکریپت های جاوا، اپلت های جاوا و یا مرورگرهای تغییر یافته در سمت کلاینت نیز پیگیری کرد. در این حالت برخلاف دو حالت قبل، مشکل تشخیص نشست های کاربران وجود ندارد. همچنین با این روش اطلاعات تفصیلی راجع به رفتار کاربر قابل دستیابی است. همچنین این امکان وجود دارد که رویدادهای متنوعی در برنامه کاربردی تعریف گردد و در صورت رخداد آنها، در فایل های ثبت، ذخیره شوند. به این ترتیب تاریخچه ای از رویدادهای مختلف تعریف شده در برنامه تولید می شود. به طور کلی در صورت ذخیره دادهها در سمت کاربر، یک تصویر کامل از چگونگی استفاده شدن کلیه سرویس ها توسط یک کاربر خاص ایجاد می شود .اما این روشها وابسته به همکاری کاربران است و ممکن است منجر به نقض قوانین مربوط به حفظ حریم خصوصی کاربران گردد[۵۴,۲۹].
۲-۷-۳-۳ کاربردهای کاربردکاوی وب
هدف اصلی کاربردکاوی وب، جمع آوری اطلاعات راجع به الگوهای پیمایش کاربران می باشد. این اطلاعات می تواند برای بهبود سایت های وب از دید کاربران به کار رود. سه کاربرد اصلی این نوع کاوش در شکل۲-۱۱ نشان داده شدهاست[۲۹].
شکل۲-۱۱.کاربردهای کاربردکاوی وب[۲۹]
تکنیک های کاربردکاوی وب، می توانند برای شخصی سازی استفاده کاربران از وب به کار روند. برای مثال می توان رفتار کاربر را از طریق مقایسه الگوی پیمایش فعلی وی با الگوهای پیمایش استخراج شده از فایل های ثبت، به صورت بلادرنگ پیش بینی کرد. سیستم های توصیه[۴۰] که یک کاربرد واقعی در این زمینه هستند، پیوندهایی که کاربر را به صفحات مورد علاقه وی هدایت می کنند، به او پیشنهاد می کنند. برخی سایت ها نیز کاتولوگ محصولات خود را براساس علایق پیش بینی شده برای کاربر خاص سازمان دهی و به او ارائه می نمایند[۲۹].
در پیش بازیابی نتایج بهدستآمده از کاربردکاوی وب می تواند برای بهبود کارایی سرورهای وب و برنامه های کاربردی مبتنی بر وب به کار رود. کاربردکاوی وب می تواند برای ایجاد استراتژی های پیش بازیابی[۴۱] و Caching استفاده شود و به این ترتیب زمان پاسخ سرورهای وب را کاهش دهد[۲۹].
در بهبود طراحی سایت های وب قابلیت استفاده[۴۲] یکی از مسائل مهم در طراحی و پیاده سازی سایت های وب است. نتایج بهدستآمده از کاربردکاوی وب می توانند به طراحی مناسب سایت های وب کمک کنند. سایت های وب تطبیقی یک کاربرد از این نوع کاوش می باشند. در این سایت ها محتوا و ساختار سایت وب به صورت پویا بر اساس دادههای استخراج شده از رفتار کاربر سازمان دهی مجدد می شوند[۲۹].
۲-۸ کاربردهای وبکاوی
وبکاوی در زمینههای مختلف کاربرد دارد ازجمله:
-
- تجارت الکترونیک :تکنیک های وب کاوی می توانند تا حد چشم گیری به موفقیت تجارت الکترونیکی کمک نمایند.برای مثال یک سایت کتاب فروشی یرای تبلیغات سایت خودش بر اساس علایق کاربران،آنها را دسته بندی کرده و تبلیغات مربوط به یک کتاب خاص را برای گروه کاربران مربوطه انجام دهد.
-
- آموزش الکترونیک :پیدا کردن الگوها ودانش نهفته درسیستم های آموزشی می تواند به تصمیم گیرندگان عرضه آموزش در جهت ارتقاء و بهبود فرایند های آموزشی نظیر برنامه ریزی، ثبت نام ، ارزیابی و مشاوره کمک شایانی نماید.
-
- آموزش از راه دور :وبکاوی در این زمینه میتواند برای تعیین کردن اینکه چه کسی به آموزش در چه ناحیه ای نیاز دارد،احتیاج کمک نماید.مثلا پیش بینی این که یک ناحیه مشخص مطمئنا در آینده نزدیک خیلی عمومی خواهد شد و احتیاج به آموزش کارکنان و توسعه در دبیرستان و دوره دانشگاه دارد.
-
- بانک داری: برای پیش بینی الگوهای کلاه برداری از طریق کارت های اعتباری ، تشخیص مشتریان ثابت ،تعیین میزان استفاده از کارت های اعتباری بر اساس گروه های اجتماعی و …استفاده میشود.
-
- کتابخانه دیجیتال: برای پاسخ دادن به سوالات خاص مربوط به کتابخانه و نیز برای کشف روندهای عمومی که به تصمیم گیری کمک میکنند، استفاده شود . برای مثال سوال میتواند چنین باشد: امکان اینکه امانت گیرندگان منابع را یک هفته بعد از تاریخ عودت برگردانند تا نامه های یادآوری کمتری فرستاده شود چقدر است؟ یا میزان اشتراک مورد انتظار برای نشریات بین المللی انتخاب شده برای سال آینده چقدر است؟
-
- دولت الکترونیک: برای درک رابطه های جمعیت شناختی، اقتصادی و اجتماعی و ارتباط عوامل داخلی مثل قیمت،قرار گیری محصول و مهارت نیروی انسانی با عوامل خارجی از جمله وضعیت اقتصادی،رقابت بازار کار و… کاربرد دارد[۳۹].
۲-۹چالش های وب کاوی
وب کاوی با چالش ها و محدودیت های متنوعی روبه رو است. از یک دیدگاه می توان این محدودیت ها را به دو گروه تکنیکی و غیر تکنیکی تقسیم کرد. از محدودیت های غیر تکنیکی می توان به عدم پشتیبانی مدیریت، کافی نبودن بودجه و عدم وجود منابع مورد نیاز مانند نیروی انسانی متخصص اشاره کرد. اما مشکلات تکنیکی بسیار است که به برخی از آنها در این جا اشاره می شود:
[دوشنبه 1401-04-13] [ 05:54:00 ب.ظ ]
|