• Web semantik
Web berprinsip arsitektur standar, bahasa dan formalisme yang menyediakan platform untuk banyak aplikasi heterogen. Hasilnya dapat mudah menjadi kacau, dan keputusan yang dibuat tentang standar yang mengatur satu formalisme dapat memiliki konsekuensi lebih,
yang tentu saja dapat menuntun untuk keputusan desain yang kompleks .
• Semantic Web
Web memulai hidup sebagai upaya untuk membuat orang untuk mengubah perilaku mereka dalam hal penting. Banyak orang membuat dokumen, namun pra-Web diasumsikan bahwa dokumen tersebut adalah milik pribadi dari penciptanya, dan keputusan untuk mempublikasikannya sendiri.
Selain itu, teknologi untuk memungkinkan orang untuk menerbitkan dan menyebarkan dokumen murah dan mudah sangat kurang. Tujuan Web adalah untuk mengubah perilaku yang radikal dan menyediakan teknologi untuk melakukannya, orang akan membuat dokumen mereka tersedia untuk orang lain dengan menambahkan link agar mereka dapat mengakses dengan mengikuti link.
Web Semantik (WS) merupakan upaya untuk memperluas potensi Web dengan ekstensi perbandingan perilaku orang. WS mencoba untuk membuat orang untuk membuat data tersedia yang dapat digunakan oleh orang lain, dan menambahkan link yang dapat diakses dengan mengikuti link tersebut. Jadi visi WS adalah sebagai perluasan dari prinsip-prinsip Web dari dokumen untuk data.
Tujuan dari WS adalah untuk memfasilitasi menggunakan data serta penemuan mereka yang melampaui Google. Dalam konteks ini adalah layak disebut perbedaan antara pengambilan informasi dan pengambilan data (alias questionanWSering otomatis).
Tujuan yang pertama adalah untuk menghasilkan dokumen yang relevan dengan query; dokumen ini tidak perlu menjadi unik, dan dua bagian berhasil mencari informasi tetap yang dapat menghasilkan hasil yang sama sekali berbeda. Tujuan yang terakhir adalah untuk menghasilkan jawaban benar dari pertanyaan. Ada perbedaan besar antara dua jenis pencarian, dan kepatuhan ketat terhadap prinsip-prinsip formal bahwa proyek terakhir membutuhkan penentu utama dari struktur seseorang yang harus dipilih ketika salah satunya menemukan skema untuk memberikan signifikansi istilah dalam pertanyaan seseorang. Data dalam arti yang sangat nyata lebih fundamental dari sebuah dokumen, maka potensi kenaikan Web sangat tinggi.
Banyak aplikasi untuk WS belum mulai beroperasi, tetapi beberapa cara datang untuk bergabung dengan potensi scruffiness bahkan baik terstruktur data dari beberapa sumber adalah sebuah isu . Strategi WS berikut, oleh karena itu, adalah untuk menyediakan kerangka kerja umum untuk pembebasan data, berdasarkan Deskripsi Resource Framework (RDF), yang mengintegrasikan berbagai aplikasi menggunakan XML sebagai pertukaran sintaks . Raw data dalam database dibawa bersama-sama, dan terhubung ke model dunia ontology yang kemudian memungkinkan agregasi dan analisa data dengan memproduksi interpretasi konsisten di seluruh heterogen sumber data pada data itu sendiri. “
• URL: Nama atau alamat? Atau keduanya?
RDF didasarkan pada identifikasi sumber daya melalui URL, dan menggambarkan mereka dalam hal sifat dan nilai properti . Membandingkan RDF dengan XLink, bahasa menghubungkan untuk XML, yang menyediakan beberapa informasi tentang link tetapi tidak memberikan rujukan eksternal untuk apapun sehubungan dengan yang link relevan. Sebaliknya, RDF memberikan URL khusus untuk hal-hal pribadi, seperti yang kita lihat di bawah ini contoh. Ketika kami membuat grafik RDF node dan busur , kita dapat melihat bahwa URL bahkan digunakan untuk hubungan. Sebuah referensi URL digunakan sebagai node dalam sebuah grafik RDF mengidentifikasi apa yang mewakili node; URL digunakan sebagai predikat suatu mengidentifikasi hubungan antara hal-hal diidentifikasi oleh node yang terhubung.
Secara umum, menggunakan URL untuk mengidentifikasi sumber daya merupakan faktor penting dalam pengembangan Web . RDFS dan semakin kompleks OWL memungkinkan pernyataan dari pembatasan hak kekayaan yang pada gilirannya memungkinkan mesin untuk membuat kesimpulan dengan cara ini. Dengan cara ini, WS ini diperkuat oleh URL, penggunaan URL memungkinkan mesin untuk proses data secara langsung memungkinkan pergeseran data.
Melakukan fungsi ini memerlukan pergeseran mendasar dalam pemahaman kita tentang bagaimana kita menggunakan URL. Biasanya, nama dan alamat-alamat berbeda, nama sesuatu merujuk langsung ke sana, alamat yang mengatakan Anda mana (jika tidak tepat bagaimana untuk mendapatkan itu). Dalam komputasi tradisional pengidentifikasi muncul dalam bahasa pemrograman, alamat adalah lokasi di memori. Nama yang dipakukan ke obyek, alamat ke tempat-tempat, dan karena itu obyek harus memiliki satu nama selamanya sementara alamatnya bisa berubah sewenang-wenang. HTTP adalah skema URL, meskipun sebuah URL HTTP mengidentifikasi objek dengan mewakili akses primer mekanisme, dan sebagainya (informal) kita bisa bicara tentang URL HTTP yang URL. Nama / alamat Perbedaan adalah sebuah metafora spasial yang bekerja dengan baik dalam lingkungan komputasi standar, tapi dalam jaringan sistem komputasi perbedaan rusak.
• Metadata
Isu-isu yang berkaitan dengan semantik atau penafsiran Web melampaui Semantic Web. Sebagai contoh, metadata dapat digunakan untuk menggambarkan atau membubuhi keterangan sumber daya dalam rangka untuk membuatnya (lebih) dimengerti untuk pengguna. Pengguna ini mungkin menjadi manusia, dalam hal metadata dapat menjadi tidak terstruktur, atau mesin, dalam hal metadata harus mesin-dibaca. Biasanya, metadata adalah deskriptif, termasuk misalnya elemen dasar sebagai nama penulis, judul atau abstrak dokumen, dan administrasi informasi seperti jenis file, hak akses, menyatakan HKI, tanggal, nomor versi dan sebagainya. item multimedia dapat dijelaskan dengan deskripsi tekstual konten, atau kata-kata kunci untuk membantu berbasis teks pencarian.
Secara umum, metadata yang penting untuk pencarian yang efektif (mereka membiarkan sumber daya yang ditemukan oleh berbagai kriteria, dan sangat membantu dalam menambah struktur dicari sumber daya non-teks), pengorganisasian sumber daya (misalnya, memungkinkan portal untuk berkumpul komposit laman web secara otomatis dari sumber daya yang sesuai-beranotasi beberapa), pengarsipan bimbingan (cf. [58]), dan informasi mengidentifikasi (seperti nomor referensi yang unik, yang membantu memecahkan masalah satu ketika sumber daya Web adalah 'sama' seperti yang lain). Mungkin penggunaan paling penting untuk metadata adalah untuk mempromosikan interoperabilitas, memungkinkan kombinasi sumber daya heterogen di seluruh platform tanpa kehilangan konten.
• Referensi dan identitas
Semantic Web mengandalkan konvensi penamaan dengan URL, dan Tentu saja setiap bagian dari sistem pelabelan Web yang bergantung pada beberapa konvensi atau lainnya. Masalah dengan label di Web adalah bahwa setiap sistem desentralisasi dan dasarnya tidak diawasi, sesuai dengan Web yang mengatur prinsip-prinsip, tetapi ini tidak sentralisasi memungkinkan skema yang berbeda dan konvensi, dan memang kecerobohan, untuk berkembang, yang pada gilirannya membuka kemungkinan kegagalan referensi unik.
• Referensi: Kapan dua benda yang sama?
Desentralisasi adalah masalah dari sudut pandang logis, meskipun besar keuntungan dari yang pencipta konten. Obyek yang sama mungkin disebut online, sempurna benar, sebagai 'Jane Doe', 'Janey Doe', 'Jane A. Doe ',' Doe, J.A. 'dan sebagainya. Selanjutnya, setiap atau semua istilah ini dapat digunakan untuk merujuk ke objek yang berbeda. Dan, tentu saja, asli Jane Doe mungkin misnamed atau salah eja: 'Jnae Doe', dll kegagalan referensi unik relatif sepele bagi pengguna manusia untuk menguraikan, tetapi tentu saja sangat sulit bagi mesin untuk bekerja keluar. Dan jika kita berharap untuk mengekstrak informasi yang berguna dari repositori yang sangat besar informasi, dimana kerajinan tangan solusi dan referensi memeriksa oleh mata tidak layak, pengolahan mesin tidak bisa dihindari. Referensi masalah yang sangat mungkin terjadi ketika sumber-sumber informasi digabung, masalah di mana-mana tapi yang serius dalam konteks dari Web Semantic. Dan desentralisasi Web menghalangi membuat asumsi nama yang unik, dalam cara [240].
Di sisi lain, URL menyediakan Web dengan sumber daya untuk menghindari setidaknya beberapa masalah grounding tradisional, ketika dapat diatasi bahwa dua istilah ini menunjuk ke URL yang sama. Jadi jika "bintang pagi" dan "bintang malam" menunjuk langsung kepada http://ex.org/planets.owl # venus maka setiap landasan lebih lanjut berlebihan. Di sisi lain, dua URL yang berbeda mungkin mengacu sama objek non-jelas, dan mungkin melakukannya hanya dengan melalui beberapa operasi di mana ia digunakan. Kadang-kadang ini akan terdeteksi melalui algoritmik analisis sintaks (misalnya, nama domain tidak case sensitif, jadi ini dapat digunakan untuk mendeteksi kesamaan), tetapi tidak secara umum. Masalahnya tidak pergi dengan penggunaan URL, tetapi mereka berada di setidaknya satu set pengidentifikasi memberikan dasar potensial bagi stabilitas di beberapa situasi - situasi khususnya ilmiah di mana perjanjian di atas simbol-simbol dan definisi sering diformalkan.
Sebuah metode heURLstik untuk menyelesaikan bentrokan tersebut, di dunia nyata, adalah untuk membuat penilaian cerdas berdasarkan informasi jaminan, dan ini telah menirukan online dengan perhitungan komunitas praktek nama, berdasarkan jaringan hubungan sekitarnya masing-masing instansi yang disengketakan. Misalnya, jika 'Jane Doe' dan 'Doe, JA 'memiliki keduanya punya asosiasi yang kuat dengan' Universitas Loamshire ', satu karena dia bekerja di sana, yang lain karena dia telah bekerja pada proyek yang UoL adalah partner, maka itu adalah bukti prima facie bahwa dua istilah mengacu pada objek yang sama - meskipun tentu saja seperti penghakiman akan selalu sangat yg dpt dibatalkan [11]. Secara umum, manajemen referensi, dan resolusi referensi masalah, akan selalu sulit mengingat bahwa theWeb mencakup sejumlah besar mengumpulkan informasi untuk sejumlah alasan yang berbeda dan untuk memecahkan berbagai tugas, makna dan interpretasi sering shift, dan ada mungkin pada kesempatan menjadi kesepakatan sedikit tentang referen istilah. Sebuah isu penting untuk Web Sains justru bagaimana memahami referensi dan representasi, dan menentukan sistem yang manajemen dan formalisms akan memungkinkan pemahaman yang lebih besar dan pelacakan dari apa yang Web ini dimaksudkan untuk mengatakan tentang yang objek.
• Kapan dua halaman yang sama?
Alternatif mengambil masalah referensi adalah bahwa penentuan ketika dua halaman web adalah halaman yang sama. Hal ini tentu saja akan menjadi sepele dalam banyak kasus, tetapi sering kali "utama" teks yang disalin dari satu halaman ke lain, tetapi dikelilingi oleh iklan yang berbeda, logo, header dan footer. Banyak metrik yang tersedia yang dimaksudkan untuk menentukan kuantitatif tingkat hubungan antara dua halaman. Kesamaan penilaian bisa sembarangan dan pragmatis, tergantung pada konteks (misalnya memutuskan plagiat atau kasus pelanggaran hak cipta), tetapi teknik dari teori informasi yang ada untuk menghasilkan set nomor tujuan untuk memberi makan ke dalam proses penilaian - misalnya, Levenshtein edit jarak, dan varian algoritma, diberikan dengan jumlah minimum operasi dari beberapa basis yang diperlukan untuk bisa mengubah satu string menjadi lain (bdk. [38]).
Dasar untuk membuat penilaian kemiripan tidak perlu hanya menjadi konten pada halaman, tetapi juga bisa menjadi struktur hyperlink dalam halaman yang tertanam. Informasi yang mengharuskan pengguna tidak perlu berasal dari satu halaman, tapi malah bisa dipetik dari cluster dokumen seputar topik dasar, dan hubungan yang struktur ada bisa sangat penting. Dan lebih jauh kemungkinan cara kesamaan pemahaman antara pola penggunaan tertentu halaman - dua halaman yang sering diakses pada titik-titik serupa di Web sesi surfing [76]? Konten berbasis kesamaan dapat didekati dengan mencocokkan kata-kata atau subsequences dari dua halaman. Teknik yang relatif sederhana digunakan untuk menentukan kemiripan antara dua halaman (rasio antara ukuran persimpangan dari subsequences dan ukuran serikat mereka), dan penahanan satu dengan yang lain (rasio antara persimpangan dan ukuran dari himpunan yang terkandung) [48]. Linkbased metrik berasal dari bibliometrics dan analisis kutipan, dan fokus pada keluar link dan link dalam dua halaman memiliki kesamaan, relatifn ke ruang umum link di cluster topik. Penggunaan berbasis metrik memanfaatkan informasi yang dikumpulkan dari server log dan sumber-sumber lain tentang ketika halaman yang dikunjungi, pada asumsi bahwa kunjungan dari yang sama pengguna dalam sesi yang sama di situs yang sama kemungkinan akan konseptual terkait, dan semakin besar kesamaan antara waktu akses pengguna untuk halaman web, semakin besar kemungkinan halaman tersebut yang entah bagaimana terkait secara konseptual .
• Web layanan
Layanan area utama di mana kami rekayasa model kebutuhan Web untuk terlibat dan jasa extended.Web didistribusikan potongan kode ditulis untuk memecahkan tugas-tugas tertentu, yang dapat berkomunikasi dengan layanan lain melalui pesan. tugas yang berskala lebih luas dapat dianalisis dan secara rekursif dipecah menjadi sub-tugas yang dengan peta keberuntungan akan ke spesifik tugas-tugas yang dapat diatasi oleh layanan. Jika itu terjadi, dan jika layanan ditempatkan dalam konteks Web, yang berarti bahwa pengguna dapat memanggil layanan yang bersama-sama dan kooperatif memenuhi kebutuhan mereka. Software abstrak jauh dari hardware dan memungkinkan kita untuk menentukan komputasi mesin dalam hal fungsi logis, yang memfasilitasi spesifikasi masalah dan solusi dengan cara yang relatif intuitif.
Perubahan dari Web untuk memasukkan penyediaan dan difusi layanan membuka prospek abstraksi baru: pertanyaan sekarang adalah bagaimana kita bisa melakukan abstraksi yang sama jauh dari perangkat lunak. Apa metode menggambarkan layanan akan memungkinkan kita untuk berhenti khawatir tentang bagaimana mereka akan dilakukan? Sejumlah metode proses menentukan telah berkembang selama beberapa tahun terakhir dan diterapkan pada domain layanan Web. Misalnya, WS-Net adalah bahasa deskripsi arsitektural berdasarkan teori Petri jaring berwarna (yaitu perluasan dari teori Petri sederhana bersih dengan terhormat, token diidentifikasi - lihat Bagian 4.2.5 untuk diskusi singkat Petri jaring), yang menggambarkan komponen layanan Web dalam hal jasa yang memberikan untuk komponen lain, layanan yang diperlukan untuk fungsi, dan operasi internal. Hasil akhirnya adalah model yang mencakup baik global dan aspek-aspek lokal dari sistem pelayanan, memfasilitasi integrasi layanan Web untuk mencapai tujuan-tujuan baru, sementara juga menyediakan sebuah formalisme untuk evaluasi integrasi [296].
• Distributed pendekatan: komputasi Pervasif, P2P dan grid
Ada banyak lingkungan hardware yang akan Web diharapkan untuk menembus, namun asumsi teknik mana yang berlaku untuk skala besar, lebih-atau-kurang tetap mesin komputasi khusus tidak harus berlaku. contoh nyata termasuk komputasi mobile, di mana-mana (Atau meresap) komputasi mana interoperabilitas menjadi masalah, P2P sistem dan komputasi grid. komputasi Mobile membuat segala macam tuntutan rekayasa, daya komputasi yang tersedia tidak luas dan pengguna harus diasumsikan terus-menerus bergerak dengan variabel bandwidth dan akses. Selain itu, menyajikan informasi kepada pengguna memerlukan paradigma yang berbeda dari PC, misalnya untuk memungkinkan pengguna untuk menerima informasi yang cukup pada layar kecil untuk membuat browsing menarik [20, 193]. Akses mobile ke Web dapat menjadi mode dominan di banyak negara, terutama yang berkembang, terima kasih untuk harga yang relatif rendah dan keandalan koneksi nirkabel dan baterai kekuasaan [222]. Penelitian di bidang ini penting untuk adil distribusi sumber daya web.
Secara umum, semua paradigma komputasi baru meningkatkan pertanyaan tentang bagaimana banyak individu yang relatif otonom dapat bekerja sama untuk menghasilkan hasil yang saling menguntungkan (baik hasil yang bermanfaat untuk masing-masing individu, atau untuk masyarakat secara keseluruhan). Koordinasi masalah seperti ini selalu tampak besar dalam banyak disiplin, dan kita seharusnya tidak akan terkejut menemukan mereka di pusat Web Science.
• Personalisasi
Hal ini sering mengklaim bahwa personalisasi itu penting untuk meningkatkan nilai dari suatu jaringan [81], dan meningkatkan konsumen lock-in [281]. Mengizinkan pengguna untuk menyesuaikan alat-alat mereka dan berarti ruang kerja yang Web tetap lebih dari commoditised satu ukuran cocok untuk semua daerah dan malah menjadi sebuah ruang di mana orang dapat mengukir sendiri niche. Selain itu, mereka juga harus dapat menerima layanan yang lebih baik, disesuaikan dengan keadaan khusus mereka sendiri dan preferensi, untuk sama atau hanya sedikit lebih biaya [90]. sistem industri tersebut adalah jelas aplikasi teknologi [6].
Untuk mendapatkan personalisasi yang efektif, harus ada pemanfaatan yang terintegrasi dari informasi dari sejumlah sumber, termasuk data tentang pengguna (clickstream data, download pola, profil online), sumber daya yang dikirim (konten situs, struktur situs) dan pengetahuan domain, bersama-sama dengan data teknis pertambangan yang cukup untuk menciptakan pandangan holistik dari sumber daya yang meliputi sebanyak mungkin informasi yang dibutuhkan pengguna, dalam representasi yang akan masuk akal bagi mereka, sementara tidak termasuk informasi mereka tidak akan mau, dan yang bisa memperhitungkan dinamika sifat model pengguna. Semua itu, sambil tetap mempertahankan hubungan antara invariants dari pengalaman Web dan konteks tertentu penggunaan seseorang yang memberdayakan dia untuk klaim sudut dari dunia maya dan mulai menggunakannya sebagai perpanjangan dari ruang pribadi.
Web berprinsip arsitektur standar, bahasa dan formalisme yang menyediakan platform untuk banyak aplikasi heterogen. Hasilnya dapat mudah menjadi kacau, dan keputusan yang dibuat tentang standar yang mengatur satu formalisme dapat memiliki konsekuensi lebih,
yang tentu saja dapat menuntun untuk keputusan desain yang kompleks .
• Semantic Web
Web memulai hidup sebagai upaya untuk membuat orang untuk mengubah perilaku mereka dalam hal penting. Banyak orang membuat dokumen, namun pra-Web diasumsikan bahwa dokumen tersebut adalah milik pribadi dari penciptanya, dan keputusan untuk mempublikasikannya sendiri.
Selain itu, teknologi untuk memungkinkan orang untuk menerbitkan dan menyebarkan dokumen murah dan mudah sangat kurang. Tujuan Web adalah untuk mengubah perilaku yang radikal dan menyediakan teknologi untuk melakukannya, orang akan membuat dokumen mereka tersedia untuk orang lain dengan menambahkan link agar mereka dapat mengakses dengan mengikuti link.
Web Semantik (WS) merupakan upaya untuk memperluas potensi Web dengan ekstensi perbandingan perilaku orang. WS mencoba untuk membuat orang untuk membuat data tersedia yang dapat digunakan oleh orang lain, dan menambahkan link yang dapat diakses dengan mengikuti link tersebut. Jadi visi WS adalah sebagai perluasan dari prinsip-prinsip Web dari dokumen untuk data.
Tujuan dari WS adalah untuk memfasilitasi menggunakan data serta penemuan mereka yang melampaui Google. Dalam konteks ini adalah layak disebut perbedaan antara pengambilan informasi dan pengambilan data (alias questionanWSering otomatis).
Tujuan yang pertama adalah untuk menghasilkan dokumen yang relevan dengan query; dokumen ini tidak perlu menjadi unik, dan dua bagian berhasil mencari informasi tetap yang dapat menghasilkan hasil yang sama sekali berbeda. Tujuan yang terakhir adalah untuk menghasilkan jawaban benar dari pertanyaan. Ada perbedaan besar antara dua jenis pencarian, dan kepatuhan ketat terhadap prinsip-prinsip formal bahwa proyek terakhir membutuhkan penentu utama dari struktur seseorang yang harus dipilih ketika salah satunya menemukan skema untuk memberikan signifikansi istilah dalam pertanyaan seseorang. Data dalam arti yang sangat nyata lebih fundamental dari sebuah dokumen, maka potensi kenaikan Web sangat tinggi.
Banyak aplikasi untuk WS belum mulai beroperasi, tetapi beberapa cara datang untuk bergabung dengan potensi scruffiness bahkan baik terstruktur data dari beberapa sumber adalah sebuah isu . Strategi WS berikut, oleh karena itu, adalah untuk menyediakan kerangka kerja umum untuk pembebasan data, berdasarkan Deskripsi Resource Framework (RDF), yang mengintegrasikan berbagai aplikasi menggunakan XML sebagai pertukaran sintaks . Raw data dalam database dibawa bersama-sama, dan terhubung ke model dunia ontology yang kemudian memungkinkan agregasi dan analisa data dengan memproduksi interpretasi konsisten di seluruh heterogen sumber data pada data itu sendiri. “
• URL: Nama atau alamat? Atau keduanya?
RDF didasarkan pada identifikasi sumber daya melalui URL, dan menggambarkan mereka dalam hal sifat dan nilai properti . Membandingkan RDF dengan XLink, bahasa menghubungkan untuk XML, yang menyediakan beberapa informasi tentang link tetapi tidak memberikan rujukan eksternal untuk apapun sehubungan dengan yang link relevan. Sebaliknya, RDF memberikan URL khusus untuk hal-hal pribadi, seperti yang kita lihat di bawah ini contoh. Ketika kami membuat grafik RDF node dan busur , kita dapat melihat bahwa URL bahkan digunakan untuk hubungan. Sebuah referensi URL digunakan sebagai node dalam sebuah grafik RDF mengidentifikasi apa yang mewakili node; URL digunakan sebagai predikat suatu mengidentifikasi hubungan antara hal-hal diidentifikasi oleh node yang terhubung.
Secara umum, menggunakan URL untuk mengidentifikasi sumber daya merupakan faktor penting dalam pengembangan Web . RDFS dan semakin kompleks OWL memungkinkan pernyataan dari pembatasan hak kekayaan yang pada gilirannya memungkinkan mesin untuk membuat kesimpulan dengan cara ini. Dengan cara ini, WS ini diperkuat oleh URL, penggunaan URL memungkinkan mesin untuk proses data secara langsung memungkinkan pergeseran data.
Melakukan fungsi ini memerlukan pergeseran mendasar dalam pemahaman kita tentang bagaimana kita menggunakan URL. Biasanya, nama dan alamat-alamat berbeda, nama sesuatu merujuk langsung ke sana, alamat yang mengatakan Anda mana (jika tidak tepat bagaimana untuk mendapatkan itu). Dalam komputasi tradisional pengidentifikasi muncul dalam bahasa pemrograman, alamat adalah lokasi di memori. Nama yang dipakukan ke obyek, alamat ke tempat-tempat, dan karena itu obyek harus memiliki satu nama selamanya sementara alamatnya bisa berubah sewenang-wenang. HTTP adalah skema URL, meskipun sebuah URL HTTP mengidentifikasi objek dengan mewakili akses primer mekanisme, dan sebagainya (informal) kita bisa bicara tentang URL HTTP yang URL. Nama / alamat Perbedaan adalah sebuah metafora spasial yang bekerja dengan baik dalam lingkungan komputasi standar, tapi dalam jaringan sistem komputasi perbedaan rusak.
• Metadata
Isu-isu yang berkaitan dengan semantik atau penafsiran Web melampaui Semantic Web. Sebagai contoh, metadata dapat digunakan untuk menggambarkan atau membubuhi keterangan sumber daya dalam rangka untuk membuatnya (lebih) dimengerti untuk pengguna. Pengguna ini mungkin menjadi manusia, dalam hal metadata dapat menjadi tidak terstruktur, atau mesin, dalam hal metadata harus mesin-dibaca. Biasanya, metadata adalah deskriptif, termasuk misalnya elemen dasar sebagai nama penulis, judul atau abstrak dokumen, dan administrasi informasi seperti jenis file, hak akses, menyatakan HKI, tanggal, nomor versi dan sebagainya. item multimedia dapat dijelaskan dengan deskripsi tekstual konten, atau kata-kata kunci untuk membantu berbasis teks pencarian.
Secara umum, metadata yang penting untuk pencarian yang efektif (mereka membiarkan sumber daya yang ditemukan oleh berbagai kriteria, dan sangat membantu dalam menambah struktur dicari sumber daya non-teks), pengorganisasian sumber daya (misalnya, memungkinkan portal untuk berkumpul komposit laman web secara otomatis dari sumber daya yang sesuai-beranotasi beberapa), pengarsipan bimbingan (cf. [58]), dan informasi mengidentifikasi (seperti nomor referensi yang unik, yang membantu memecahkan masalah satu ketika sumber daya Web adalah 'sama' seperti yang lain). Mungkin penggunaan paling penting untuk metadata adalah untuk mempromosikan interoperabilitas, memungkinkan kombinasi sumber daya heterogen di seluruh platform tanpa kehilangan konten.
• Referensi dan identitas
Semantic Web mengandalkan konvensi penamaan dengan URL, dan Tentu saja setiap bagian dari sistem pelabelan Web yang bergantung pada beberapa konvensi atau lainnya. Masalah dengan label di Web adalah bahwa setiap sistem desentralisasi dan dasarnya tidak diawasi, sesuai dengan Web yang mengatur prinsip-prinsip, tetapi ini tidak sentralisasi memungkinkan skema yang berbeda dan konvensi, dan memang kecerobohan, untuk berkembang, yang pada gilirannya membuka kemungkinan kegagalan referensi unik.
• Referensi: Kapan dua benda yang sama?
Desentralisasi adalah masalah dari sudut pandang logis, meskipun besar keuntungan dari yang pencipta konten. Obyek yang sama mungkin disebut online, sempurna benar, sebagai 'Jane Doe', 'Janey Doe', 'Jane A. Doe ',' Doe, J.A. 'dan sebagainya. Selanjutnya, setiap atau semua istilah ini dapat digunakan untuk merujuk ke objek yang berbeda. Dan, tentu saja, asli Jane Doe mungkin misnamed atau salah eja: 'Jnae Doe', dll kegagalan referensi unik relatif sepele bagi pengguna manusia untuk menguraikan, tetapi tentu saja sangat sulit bagi mesin untuk bekerja keluar. Dan jika kita berharap untuk mengekstrak informasi yang berguna dari repositori yang sangat besar informasi, dimana kerajinan tangan solusi dan referensi memeriksa oleh mata tidak layak, pengolahan mesin tidak bisa dihindari. Referensi masalah yang sangat mungkin terjadi ketika sumber-sumber informasi digabung, masalah di mana-mana tapi yang serius dalam konteks dari Web Semantic. Dan desentralisasi Web menghalangi membuat asumsi nama yang unik, dalam cara [240].
Di sisi lain, URL menyediakan Web dengan sumber daya untuk menghindari setidaknya beberapa masalah grounding tradisional, ketika dapat diatasi bahwa dua istilah ini menunjuk ke URL yang sama. Jadi jika "bintang pagi" dan "bintang malam" menunjuk langsung kepada http://ex.org/planets.owl # venus maka setiap landasan lebih lanjut berlebihan. Di sisi lain, dua URL yang berbeda mungkin mengacu sama objek non-jelas, dan mungkin melakukannya hanya dengan melalui beberapa operasi di mana ia digunakan. Kadang-kadang ini akan terdeteksi melalui algoritmik analisis sintaks (misalnya, nama domain tidak case sensitif, jadi ini dapat digunakan untuk mendeteksi kesamaan), tetapi tidak secara umum. Masalahnya tidak pergi dengan penggunaan URL, tetapi mereka berada di setidaknya satu set pengidentifikasi memberikan dasar potensial bagi stabilitas di beberapa situasi - situasi khususnya ilmiah di mana perjanjian di atas simbol-simbol dan definisi sering diformalkan.
Sebuah metode heURLstik untuk menyelesaikan bentrokan tersebut, di dunia nyata, adalah untuk membuat penilaian cerdas berdasarkan informasi jaminan, dan ini telah menirukan online dengan perhitungan komunitas praktek nama, berdasarkan jaringan hubungan sekitarnya masing-masing instansi yang disengketakan. Misalnya, jika 'Jane Doe' dan 'Doe, JA 'memiliki keduanya punya asosiasi yang kuat dengan' Universitas Loamshire ', satu karena dia bekerja di sana, yang lain karena dia telah bekerja pada proyek yang UoL adalah partner, maka itu adalah bukti prima facie bahwa dua istilah mengacu pada objek yang sama - meskipun tentu saja seperti penghakiman akan selalu sangat yg dpt dibatalkan [11]. Secara umum, manajemen referensi, dan resolusi referensi masalah, akan selalu sulit mengingat bahwa theWeb mencakup sejumlah besar mengumpulkan informasi untuk sejumlah alasan yang berbeda dan untuk memecahkan berbagai tugas, makna dan interpretasi sering shift, dan ada mungkin pada kesempatan menjadi kesepakatan sedikit tentang referen istilah. Sebuah isu penting untuk Web Sains justru bagaimana memahami referensi dan representasi, dan menentukan sistem yang manajemen dan formalisms akan memungkinkan pemahaman yang lebih besar dan pelacakan dari apa yang Web ini dimaksudkan untuk mengatakan tentang yang objek.
• Kapan dua halaman yang sama?
Alternatif mengambil masalah referensi adalah bahwa penentuan ketika dua halaman web adalah halaman yang sama. Hal ini tentu saja akan menjadi sepele dalam banyak kasus, tetapi sering kali "utama" teks yang disalin dari satu halaman ke lain, tetapi dikelilingi oleh iklan yang berbeda, logo, header dan footer. Banyak metrik yang tersedia yang dimaksudkan untuk menentukan kuantitatif tingkat hubungan antara dua halaman. Kesamaan penilaian bisa sembarangan dan pragmatis, tergantung pada konteks (misalnya memutuskan plagiat atau kasus pelanggaran hak cipta), tetapi teknik dari teori informasi yang ada untuk menghasilkan set nomor tujuan untuk memberi makan ke dalam proses penilaian - misalnya, Levenshtein edit jarak, dan varian algoritma, diberikan dengan jumlah minimum operasi dari beberapa basis yang diperlukan untuk bisa mengubah satu string menjadi lain (bdk. [38]).
Dasar untuk membuat penilaian kemiripan tidak perlu hanya menjadi konten pada halaman, tetapi juga bisa menjadi struktur hyperlink dalam halaman yang tertanam. Informasi yang mengharuskan pengguna tidak perlu berasal dari satu halaman, tapi malah bisa dipetik dari cluster dokumen seputar topik dasar, dan hubungan yang struktur ada bisa sangat penting. Dan lebih jauh kemungkinan cara kesamaan pemahaman antara pola penggunaan tertentu halaman - dua halaman yang sering diakses pada titik-titik serupa di Web sesi surfing [76]? Konten berbasis kesamaan dapat didekati dengan mencocokkan kata-kata atau subsequences dari dua halaman. Teknik yang relatif sederhana digunakan untuk menentukan kemiripan antara dua halaman (rasio antara ukuran persimpangan dari subsequences dan ukuran serikat mereka), dan penahanan satu dengan yang lain (rasio antara persimpangan dan ukuran dari himpunan yang terkandung) [48]. Linkbased metrik berasal dari bibliometrics dan analisis kutipan, dan fokus pada keluar link dan link dalam dua halaman memiliki kesamaan, relatifn ke ruang umum link di cluster topik. Penggunaan berbasis metrik memanfaatkan informasi yang dikumpulkan dari server log dan sumber-sumber lain tentang ketika halaman yang dikunjungi, pada asumsi bahwa kunjungan dari yang sama pengguna dalam sesi yang sama di situs yang sama kemungkinan akan konseptual terkait, dan semakin besar kesamaan antara waktu akses pengguna untuk halaman web, semakin besar kemungkinan halaman tersebut yang entah bagaimana terkait secara konseptual .
• Web layanan
Layanan area utama di mana kami rekayasa model kebutuhan Web untuk terlibat dan jasa extended.Web didistribusikan potongan kode ditulis untuk memecahkan tugas-tugas tertentu, yang dapat berkomunikasi dengan layanan lain melalui pesan. tugas yang berskala lebih luas dapat dianalisis dan secara rekursif dipecah menjadi sub-tugas yang dengan peta keberuntungan akan ke spesifik tugas-tugas yang dapat diatasi oleh layanan. Jika itu terjadi, dan jika layanan ditempatkan dalam konteks Web, yang berarti bahwa pengguna dapat memanggil layanan yang bersama-sama dan kooperatif memenuhi kebutuhan mereka. Software abstrak jauh dari hardware dan memungkinkan kita untuk menentukan komputasi mesin dalam hal fungsi logis, yang memfasilitasi spesifikasi masalah dan solusi dengan cara yang relatif intuitif.
Perubahan dari Web untuk memasukkan penyediaan dan difusi layanan membuka prospek abstraksi baru: pertanyaan sekarang adalah bagaimana kita bisa melakukan abstraksi yang sama jauh dari perangkat lunak. Apa metode menggambarkan layanan akan memungkinkan kita untuk berhenti khawatir tentang bagaimana mereka akan dilakukan? Sejumlah metode proses menentukan telah berkembang selama beberapa tahun terakhir dan diterapkan pada domain layanan Web. Misalnya, WS-Net adalah bahasa deskripsi arsitektural berdasarkan teori Petri jaring berwarna (yaitu perluasan dari teori Petri sederhana bersih dengan terhormat, token diidentifikasi - lihat Bagian 4.2.5 untuk diskusi singkat Petri jaring), yang menggambarkan komponen layanan Web dalam hal jasa yang memberikan untuk komponen lain, layanan yang diperlukan untuk fungsi, dan operasi internal. Hasil akhirnya adalah model yang mencakup baik global dan aspek-aspek lokal dari sistem pelayanan, memfasilitasi integrasi layanan Web untuk mencapai tujuan-tujuan baru, sementara juga menyediakan sebuah formalisme untuk evaluasi integrasi [296].
• Distributed pendekatan: komputasi Pervasif, P2P dan grid
Ada banyak lingkungan hardware yang akan Web diharapkan untuk menembus, namun asumsi teknik mana yang berlaku untuk skala besar, lebih-atau-kurang tetap mesin komputasi khusus tidak harus berlaku. contoh nyata termasuk komputasi mobile, di mana-mana (Atau meresap) komputasi mana interoperabilitas menjadi masalah, P2P sistem dan komputasi grid. komputasi Mobile membuat segala macam tuntutan rekayasa, daya komputasi yang tersedia tidak luas dan pengguna harus diasumsikan terus-menerus bergerak dengan variabel bandwidth dan akses. Selain itu, menyajikan informasi kepada pengguna memerlukan paradigma yang berbeda dari PC, misalnya untuk memungkinkan pengguna untuk menerima informasi yang cukup pada layar kecil untuk membuat browsing menarik [20, 193]. Akses mobile ke Web dapat menjadi mode dominan di banyak negara, terutama yang berkembang, terima kasih untuk harga yang relatif rendah dan keandalan koneksi nirkabel dan baterai kekuasaan [222]. Penelitian di bidang ini penting untuk adil distribusi sumber daya web.
Secara umum, semua paradigma komputasi baru meningkatkan pertanyaan tentang bagaimana banyak individu yang relatif otonom dapat bekerja sama untuk menghasilkan hasil yang saling menguntungkan (baik hasil yang bermanfaat untuk masing-masing individu, atau untuk masyarakat secara keseluruhan). Koordinasi masalah seperti ini selalu tampak besar dalam banyak disiplin, dan kita seharusnya tidak akan terkejut menemukan mereka di pusat Web Science.
• Personalisasi
Hal ini sering mengklaim bahwa personalisasi itu penting untuk meningkatkan nilai dari suatu jaringan [81], dan meningkatkan konsumen lock-in [281]. Mengizinkan pengguna untuk menyesuaikan alat-alat mereka dan berarti ruang kerja yang Web tetap lebih dari commoditised satu ukuran cocok untuk semua daerah dan malah menjadi sebuah ruang di mana orang dapat mengukir sendiri niche. Selain itu, mereka juga harus dapat menerima layanan yang lebih baik, disesuaikan dengan keadaan khusus mereka sendiri dan preferensi, untuk sama atau hanya sedikit lebih biaya [90]. sistem industri tersebut adalah jelas aplikasi teknologi [6].
Untuk mendapatkan personalisasi yang efektif, harus ada pemanfaatan yang terintegrasi dari informasi dari sejumlah sumber, termasuk data tentang pengguna (clickstream data, download pola, profil online), sumber daya yang dikirim (konten situs, struktur situs) dan pengetahuan domain, bersama-sama dengan data teknis pertambangan yang cukup untuk menciptakan pandangan holistik dari sumber daya yang meliputi sebanyak mungkin informasi yang dibutuhkan pengguna, dalam representasi yang akan masuk akal bagi mereka, sementara tidak termasuk informasi mereka tidak akan mau, dan yang bisa memperhitungkan dinamika sifat model pengguna. Semua itu, sambil tetap mempertahankan hubungan antara invariants dari pengalaman Web dan konteks tertentu penggunaan seseorang yang memberdayakan dia untuk klaim sudut dari dunia maya dan mulai menggunakannya sebagai perpanjangan dari ruang pribadi.