به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت

جستجوی مقالات مرتبط با کلیدواژه "data matching" در نشریات گروه "عمران"

تکرار جستجوی کلیدواژه «data matching» در نشریات گروه «فنی و مهندسی»
جستجوی data matching در مقالات مجلات علمی
  • بهزاد واحدی طرقبه *، علی اصغر آل شیخ
    از زمان پیدایش مفهوم اطلاعات مکانی مردم گستر (داوطلبانه)1 کیفیت این اطلاعات به عنوان بزرگترین مشکل آن معرفی شده است. بنابراین تا کنون تحقیقات مختلفی به بررسی کیفیت داده های مردم گستر پرداخته و سعی در برآورد کیفیت این اطلاعات داشته اند. اما در این تحقیقات به دقت توصیفی کمتر از سایر المان های کیفیت پرداخته شده است؛ در حالیکه این المان در آنالیزهای گوناگون مکانی و کاربردهای مختلف اطلاعات مردم گستر از اهمیت بالایی برخوردار است. بنابراین در این تحقیق با استفاده از یک روش جدید و با استفاده از الگوریتم Levenshtein به همراه پیش پردازش های متنی، دقت توصیفی عوارض مردم گستر (در قالب نام عارضه) با مقایسه آنها با عوارض مرجع مورد بررسی قرار می گیرد. برای محاسبه دقت توصیفی فرض می شود که بین عوارض مرجع و مردم گستر تناظریابی انجام شده است. منطقه مورد مطالعه این تحقیق شهر تهران است و از داده های تولیدی شهرداری تهران به عنوان مجموعه داده مرجع و از داده های سایت OpenStreetMap به عنوان مجموعه داده مردم گستر استفاده شده است. طبق نتایج حاصل، 33 درصد از عوارض مردم گستر دارای نام، نام صحیح، 44 درصد از آن ها نام تقریبا صحیح و 23 درصد باقیمانده نام نادرست دارند و دقت توصیفی کل داده های مردم گستر برابر 77 درصد می باشد.
    کلید واژگان: اطلاعات مکانی مردم گستر, دقت توصیفی, الگوریتم Levenshtein, کیفیت اطلاعات مکانی, تناظریابی, OpenStreetMap
    B. Vahedi *, A. A. Alesheikh
    Since the emergence of the concept of Volunteered Geographic Information (VGI), the quality of this type of information is presented as its biggest problem. Therefore, this issue has been addressed frequently in the literature, and scientists have tried to evaluate the quality of VGI. However, attribute accuracy, despite its important role in a variety of spatial analyses and applications of VGI, has received less attention in comparison to other elements of quality in the literature. Positional accuracy, completeness, lineage, resolution, and time accuracy are among the most important elements of spatial data quality.
    In this study, using a novel method and by leveraging Levenshtein algorithm along with text pre-processing, attribute accuracy of volunteered geographic features is examined, comparing this data with reference data. Levenshtein algorithm calculates the difference between two strings of text by counting the number of changes (edits) necessary to change one word to another, and thus sometimes is referred to as Levenshtein distance.
    The first step of the proposed method is to find corresponding features in the two data sets to perform the comparison based on. This step is done by applying an automatic data matching algorithm between the two sets. This algorithm consists of five stages, each applied on either the reference data set or the VGI data set.
    After data matching is done, each VGI feature is compared with its corresponding match in the reference data set and the Levenshtein distance between the “name” attribute of these two features is calculated. Then, features are categorized as having correct (accurate), approximately correct, or incorrect names based on the Levenshtein distance and assuming that the name of the reference features are correct. For VGI features without a match in the reference data set, a search distance is defined, inside which reference features with the exact same name as the VGI feature are sought.
    The study area of this research is Tehran city, Iran. A data set produced by the municipality of Tehran is used as the reference data set and OpenStreetMap data as the VGI data set. According to the results, 47 percent of VGI features have a name attribute and among these, 33 percent of them have correct name, 44 percent have approximately correct name, and the remaining 23 percent have incorrect names. The Overall attribute accuracy of the VGI data set used in this study, is thus 77 percent, indicating that among those features that have a name attribute, 77 percent of them have either correct or approximately correct names. A future line of research, based on the findings of this paper, could be to develop methods for evaluating the attribute accuracy of a data set without having to compare it with a reference data set.
    Keywords: Volunteered Geographic Information, attribute accuracy, Levenshtein algorithm, spatial data quality, data matching, OpenStreetMap
  • علی فراهانی پویا*، رحیم علی عباسپور، سیدکاظم علوی پناه، منصور جعفربیگلو
    با پیشرفت سریع تولید و جمع آوری داده های مکانی و تکنیک های پردازش آن ها، همواره حجم عظیمی از داده ها که ناحیه جغرافیایی یکسانی را می پوشاند، در دسترس قرار می گیرد. این حجم داده، متخصصین حوزه علوم ژئوماتیک را به ایجاد پایگاه داده چندمقیاسی با اهدافی مانند به روز رسانی مجموعه داده ها و آنالیزهای چندمقیاسی ترغیب کرده است. هسته اصلی تولید پایگاه های چندمقیاسی، فرآیند تناظریابی داده ها می باشد. در این مقاله الگوریتم جدیدی برای تناظریابی داده با هدف تولید پایگاه های داده چندمقیاسی ارائه شده است. الگوریتم پیشنهادی در سه فاز اصلی پیاده سازی شده است. در فاز اول پیش پردازش انجام شده و در فاز دوم به جستجوی و شناسایی عوارض کاندیدا در بین دو مجموعه داده برمبنای ویژگی های توپولوژیک پرداخته می شود. در فاز سوم، با استفاده از روش کمترین مربعات، خطی به عنوان بهترین نماینده برای هر عارضه راه محاسبه شده و با مقایسه ویژگی های هندسی نماینده عارضه راه، بین عوارض کاندیدای مرحله قبل، بهترین جفت متناظر انتخاب می شود. این الگوریتم بر روی معابر برون شهری نقشه های در مقیاس 1:25000 و1:50000 تولیدی سازمان نقشه برداری کشور پیاده سازی شده است. نتایج ارزیابی موفق الگوریتم را نشان می دهد، بطوری که 2/94 درصد عوارض خطی راه به درستی به عنوان جفت عارضه متناظر شناخته شدند.
    کلید واژگان: تناظریابی داده, عوارض متناظر, ویژگی های توپولوژیک, کمترین مربعات, پایگاه داده مکانی چندمقیاسی
    A. Farahanipooya*, R. A. Abbaspour, S. K. Alavipanah, M. Jafarbeiglu
    With the rapid development of spatial data production, collection, and processing techniques large amounts of data, which cover the same geographical extent, are available. These huge amounts of data motivate the researchers in geospatial analysis domain to create multiscale database in order to update the datasets and perform the multi-scale analysis. In the core of any spatial multiscale database is the data matching process. In this paper, a new algorithm is proposed for data matching which is implemented and evaluated in two major steps. Firstly, after pre-processing, the search and identification of candidate objects in the two datasets are carried out based on the topological features. Secondly, the best pair of corresponding objects is selected using the least squares method and comparing the geometric features of linear objects between the candidate object selected in the previous step. The algorithm is evaluated on the roads maps of scales1:25000 and1:50000 produced by national cartography center of Iran (NCC).The results show that the algorithm is successful and 94.2% of the objects were correctly identified as the corresponding pairs.
    Keywords: data matching, topology, least squares, multi, scale spatial database
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال