کاربردکاوی وب به استخراج الگوهایی بامعنی از داده‌های تولید شده در تعامل بین کلاینت و سرورهای وب می پردازد. این نوع کاوش بر تکنیک­هایی تمرکز دارد که رفتار کاربر را در زمان تعامل با وب پیش ­بینی می­ کند. داده­ای که در این نوع کاوش مورد استفاده قرار می­گیرد، داده­هایی است که در نتیجه تعامل کاربران با وب ایجاد و نگهداری شده ­اند. کاربردهای این نوع کاوش، معمولا شامل خصوصی­سازی وب، ایجاد سایت­های وب تطبیقی، مدل سازی کاربر، … می­­باشد[۵۴,۴۱].
در سال های اخیر تحقیقات وسیعی در زمینه کاربردکاوی وب انجام شده‌است. در این بخش ابتدا انواع داده ای که در این شاخه از وب کاوی استفاده می شود، معرقی می شوند. سپس تکنیک هایی که برای پیش پردازش و جداسازی داده‌های جمع­آوری شده به کار می­روند، بررسی می­شوند. همچنین تکنیک­­های کاوش و کاربردهای کاربردکاوی وب تشریح می گردند[۵۴].

(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))

۲-۷-۳-۱ فازهای کاربرد کاوی وب
فازهای کاربرد کاوی وب را در جدول ۲-۴ به تصویر کشیده شده‌است[۵۴,۴۱].
جدول۲-۴.فاز های کاربردکاوی وب[۵۴,۴۱]

پیش پردازش
اولین روش برای بازیابی داده ی خام از منابع وب و پردازش داده‌ها بر اساس مشتری، سرور و پروکسی سرور است. و به طور خودکار به داده‌های خام اصلی تبدیل شده‌است و شامل چهار مرحله پاکسازی داده، تشخیص و بازسازی نشست های کاربران، بازیابی اطلاعات مربوط به محتوا و ساختار صفحه و قالب بندی داده می‌شود.
کشف الگو
بر اساس پردازش داده‌ها، دانش و پیاده سازی تکنیک هارا کشف می‌کند برای کشف دانش از یادگیری ماشین و روش‌های داده کاوی استفاده می‌کند.
تجزیه و تحلیل الگو
تجزیه و تحلیل الگوی فرایند پس از کشف الگو است . آن الگویی که در وب صحیح است را چک می‌کندو چگونگی پیاده سازی در وب برای استخراج اطلاعات را درجستجو وب به شما می گوید در واقع استخراج دانش از وب است.

۲-۷-۳-۲ انواع داده‌های کاربردکاوی وب
داده‌های کاربرد کاوی وب[۳۶] مشخصات کاربران و رفتار پیمایش آن‌ها در سایت های وب را مشخص می نمایدکه انواع آن درشکل ۲-۱۰ نشان داده شده‌است[۵۴,۲۹].
.
شکل ۲-۱۰.داده‌های کاربرد کاوی وب[۵۴,۲۹]
سرورهای وب غنی­ترین و رایج­ترین منبع داده‌های استفاده از وب هستند. آن‌ها داده‌ها را در فایل های ثبت[۳۷] خود و فایل های ثبت پایگاه داده‌هایی که استفاده می کنند، ذخیره می نمایند. داده‌های سرورهای وب، معمولا شامل آدرس های IP، زمان و تاریخ دستیابی ها و … می باشند و معمولا در قالب های استاندارد مانند Common Log Format، Extended Log Format، LogML، بازنمایی می شوند[۵۴,۲۹].
یک چالش اصلی در استفاده از سرورهای وب، تشخیص نشست[۳۸] های کاربر (دسته بندی تقاضاهای کاربر به گونه ای که مسیر پیمایش وی در سایت مشخص شود) می باشد. نحوه انجام این کار به نوع داده‌هایی که در فایل های ثبت ذخیره می شود، بستگی دارد. رایج ترین روش برای تشخیص نشست های کاربر، استفاده از Cookie ها می باشد[۵۴,۲۹].
به غیر از فایل های ثبت، می توان از شنود[۳۹] بسته های TCP/IP برای ردیابی رفتار کاربران استفاده کرد. همچنین برخی از سرورهای برنامه های کاربردی، تعاملات کاربران با سرور را ردیابی کرده و آن‌ها را در فایل های ثبت سرور نگهداری می کنند. به طور کلی در صورت ذخیره داده‌ها در سمت سرور، یک تصویر کلی از چگونگی استفاده شدن یک سرویس توسط تمام کاربران وجود دارد[۵۴,۲۹].
جمع آوری داده‌های سرورهای پراکسی مربوط به پیمایش کاربران در سرورهای پراکسی مشابه جمع آوری داده‌ها در سرورهای وب است. تفاوت اصلی در اینجا آن است که سرورهای پراکسی داده‌های گروه هایی از کاربران را که به تعداد زیادی از سرورهای وب مراجعه می کنند، جمع آوری می کنند. در این حالت نیز تشخیص نشست های کاربران مشکل است و نمی توان کلیه مسیرهای پیمایش کاربران را تشخیص داد.
داده‌های کلاینت به این صورت است که داده‌های استفاده از وب را می توان با بهره گرفتن از اسکریپت های جاوا، اپلت های جاوا و یا مرورگرهای تغییر یافته در سمت کلاینت نیز پیگیری کرد. در این حالت برخلاف دو حالت قبل، مشکل تشخیص نشست های کاربران وجود ندارد. همچنین با این روش اطلاعات تفصیلی راجع به رفتار کاربر قابل دستیابی است. همچنین این امکان وجود دارد که رویدادهای متنوعی در برنامه کاربردی تعریف گردد و در صورت رخداد آن‌ها، در فایل های ثبت، ذخیره شوند. به این ترتیب تاریخچه ای از رویدادهای مختلف تعریف شده در برنامه تولید می شود. به طور کلی در صورت ذخیره داده‌ها در سمت کاربر، یک تصویر کامل از چگونگی استفاده شدن کلیه سرویس ها توسط یک کاربر خاص ایجاد می شود .اما این روش‌ها وابسته به همکاری کاربران است و ممکن است منجر به نقض قوانین مربوط به حفظ حریم خصوصی کاربران گردد[۵۴,۲۹].
۲-۷-۳-۳ کاربردهای کاربردکاوی وب
هدف اصلی کاربردکاوی وب، جمع آوری اطلاعات راجع به الگوهای پیمایش کاربران می باشد. این اطلاعات می تواند برای بهبود سایت های وب از دید کاربران به کار رود. سه کاربرد اصلی این نوع کاوش در شکل۲-۱۱ نشان داده شده‌است[۲۹].
شکل۲-۱۱.کاربردهای کاربردکاوی وب[۲۹]
تکنیک های کاربردکاوی وب، می توانند برای شخصی سازی استفاده کاربران از وب به کار روند. برای مثال می توان رفتار کاربر را از طریق مقایسه الگوی پیمایش فعلی وی با الگوهای پیمایش استخراج شده از فایل های ثبت، به صورت بلادرنگ پیش بینی کرد. سیستم های توصیه[۴۰] که یک کاربرد واقعی در این زمینه هستند، پیوندهایی که کاربر را به صفحات مورد علاقه وی هدایت می کنند، به او پیشنهاد می کنند. برخی سایت ها نیز کاتولوگ محصولات خود را براساس علایق پیش بینی شده برای کاربر خاص سازمان دهی و به او ارائه می نمایند[۲۹].
در پیش بازیابی نتایج به‌دست‌آمده از کاربردکاوی وب می تواند برای بهبود کارایی سرورهای وب و برنامه های کاربردی مبتنی بر وب به کار رود. کاربردکاوی وب می تواند برای ایجاد استراتژی های پیش بازیابی[۴۱] و Caching استفاده شود و به این ترتیب زمان پاسخ سرورهای وب را کاهش دهد[۲۹].
در بهبود طراحی سایت های وب قابلیت استفاده[۴۲] یکی از مسائل مهم در طراحی و پیاده سازی سایت های وب است. نتایج به‌دست‌آمده از کاربردکاوی وب می توانند به طراحی مناسب سایت های وب کمک کنند. سایت های وب تطبیقی یک کاربرد از این نوع کاوش می باشند. در این سایت ها محتوا و ساختار سایت وب به صورت پویا بر اساس داده‌های استخراج شده از رفتار کاربر سازمان دهی مجدد می شوند[۲۹].
۲-۸ کاربردهای وب‌کاوی
وب‌کاوی در زمینه‌های مختلف کاربرد دارد ازجمله:

    • تجارت الکترونیک :تکنیک های وب کاوی می توانند تا حد چشم گیری به موفقیت تجارت الکترونیکی کمک نمایند.برای مثال یک سایت کتاب فروشی یرای تبلیغات سایت خودش بر اساس علایق کاربران،آن‌ها را دسته بندی کرده و تبلیغات مربوط به یک کتاب خاص را برای گروه کاربران مربوطه انجام دهد.
    • آموزش الکترونیک :پیدا کردن الگوها ودانش نهفته درسیستم های آموزشی می تواند به تصمیم گیرندگان عرضه آموزش در جهت ارتقاء و بهبود فرایند های آموزشی نظیر برنامه ریزی، ثبت نام ، ارزیابی و مشاوره کمک شایانی نماید.
    • آموزش از راه دور :وب‌کاوی در این زمینه می‌تواند برای تعیین کردن اینکه چه کسی به آموزش در چه ناحیه ای نیاز دارد،احتیاج کمک نماید.مثلا پیش بینی این که یک ناحیه مشخص مطمئنا در آینده نزدیک خیلی عمومی خواهد شد و احتیاج به آموزش کارکنان و توسعه در دبیرستان و دوره دانشگاه دارد.
    • بانک داری: برای پیش بینی الگوهای کلاه برداری از طریق کارت های اعتباری ، تشخیص مشتریان ثابت ،تعیین میزان استفاده از کارت های اعتباری بر اساس گروه های اجتماعی و …استفاده می‌شود.
    • کتابخانه دیجیتال: برای پاسخ دادن به سوالات خاص مربوط به کتابخانه و نیز برای کشف روندهای عمومی که به تصمیم گیری کمک می‌کنند، استفاده شود . برای مثال سوال می‌تواند چنین باشد: امکان اینکه امانت گیرندگان منابع را یک هفته بعد از تاریخ عودت برگردانند تا نامه های یادآوری کمتری فرستاده شود چقدر است؟ یا میزان اشتراک مورد انتظار برای نشریات بین المللی انتخاب شده برای سال آینده چقدر است؟
    • دولت الکترونیک: برای درک رابطه های جمعیت شناختی، اقتصادی و اجتماعی و ارتباط عوامل داخلی مثل قیمت،قرار گیری محصول و مهارت نیروی انسانی با عوامل خارجی از جمله وضعیت اقتصادی،رقابت بازار کار و… کاربرد دارد[۳۹].

۲-۹چالش های وب کاوی
وب کاوی با چالش ها و محدودیت های متنوعی روبه رو است. از یک دیدگاه می توان این محدودیت ها را به دو گروه تکنیکی و غیر تکنیکی تقسیم کرد. از محدودیت های غیر تکنیکی می توان به عدم پشتیبانی مدیریت، کافی نبودن بودجه و عدم وجود منابع مورد نیاز مانند نیروی انسانی متخصص اشاره کرد. اما مشکلات تکنیکی بسیار است که به برخی از آن‌ها در این جا اشاره می شود:

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...