Schedule: Thursday 27th October 2011

Programme at a Glance
	Argyll 1	Argyll 2	Argyll 3	Barra & Jura	Staffa & Shuna	Castle
Thursday 27th October 2011
08:30-09:15	Keynote - Maurizio Lenzerini
09:15-09:30	Demo Boasters 3
09:30-10:00	Coffee break and Demos 3
10:00-12:00	Social Media	Classification and Clustering: Large-scale Statistical Techniques	Industry Event Session 1	Link Prediction	Graph Management and Queries
12:00-13:30	Lunch
13:30-15:30	Personalization and Advertising	Link, Graph and Relation Mining	Industry Event Session 2	Science, the Past, and the Future	Information Extraction and Entities
15:30-16:00	Coffee break
16:00-17:40	Algorithms	Queries, Questions and Tags Mining	Industry Event Session 3	Preparing, Mining and Evaluating with and for Different Views	Information Extraction and Semantic Techniques	DB posters
17:40-18:00	Closing Ceremony

Social Media (10:00-12:00)

Room: Argyll 1
Chair: Jun Wang

Towards a Framework for Attribute Retrieval
Arlind Kopliku, Mohand Boughanem, Karen Pinel-Sauvagnat (IRIT, University of Toulouse)

Building Directories for Social Tagging Systems
Denis Helic (Knowledge Management Institute, Graz University of Technology), Markus Strohmaier (Knowledge Management Institute and Know-Center, Graz University of Technology)

Workload-Aware Indexing for Keyword Search in Social Networks
Truls A. Bjørklund (Norwegian University of Science and Technology), Michaela Götz, Johannes Gehrke (Cornell University), Nils Grimsmo (Norwegian University of Science and Technology)

Effective Retrieval of Resources in Folksonomies Using a New Tag Similarity Measure [short]
Giovanni Quattrone, Licia Capra (University College London), Pasquale De Meo, Emilio Ferrara (University of Messina), Domenico Ursino (Università Mediterranea di Reggio Calabria)

Content-Driven Detection of Campaigns in Social Media [short]
Kyumin Lee, James Caverlee, Zhiyuan Cheng (Texas A&M University), Daniel Z. Sui (Ohio State University)

Exploring Categorization Property of Social Annotations for Information Retrieval [short]
Peng Li, Bin Wang (Institute of Computing Technology, Chinese Academy of Sciences), Wei Jin (North Dakota State University), Jian-Yun Nie (University of Montreal), Zhiwei Shi (Institute of Computing Technology, Chinese Academy of Sciences), Ben He (Graduate University of Chinese Academy of Sciences)

Classification and Clustering: Large-scale Statistical Techniques (10:00-12:00)

Room: Argyll 2
Chair: Alfredo Cuzzocrea

Scalable Density-Based Subspace Clustering
Emmanuel Müller (Karlsruhe Institute of Technology), Ira Assent (Aarhus University), Stephan Günnemann, Thomas Seidl (RWTH Aachen University)

Correlated Multi-Label Feature Selection
Quanquan Gu, Zhenhui Li, Jiawei Han (University of Illinois at Urbana-Champaign)

Pattern Change Discovery between High Dimensional Data Sets
Yi Xu, Zhongfei Zhang (Binghamton University), Philips Yu (University of Illinois at Chicago), Bo Long (Yahoo! Inc)

MTopS: Scalable Processing of Continuous Top-K Multi-Query Workloads
Avani Shastri, Yang Di (Worcester Polytechnic Institute), Elke A. Rundensteiner (Ins), Matthew O. Ward (Worcester Polytechnic Institute)

Probabilistic Near-Duplicate Detection Using Simhash
Sadhan Sood, Dmitri Loguinov (Texas A&M University)

Link Prediction (10:00-12:00)

Room: Shuna & Staffa
Chair: B. Barla Cambazoglu

Collective Prediction with Latent Graphs
Xiaoxiao Shi, Yao Li, Philip Yu (University of Illinois at Urbana-Champaign)

Who Will Follow You Back? Reciprocal Relationship Prediction
John Hopcroft (Cornell University), Tiancheng Lou, Jie Tang (Tsinghua University)

Link Prediction: the Power of Maximal Entropy Random Walk
Rong-Hua Li, Jeffrey Xu Yu (The Chinese University of Hong Kong), Jianquan Liu (University of Tsukuba)

Exploiting Longer Cycles for Link Prediction in Signed Networks [short]
Kai-Yang Chiang, Nagarajan Natarajan, Ambuj Tewari, Inderjit S Dhillon (University of Austin at Texas)

Structural Link Analysis and Prediction in Microblogs [short]
Dawei Yin, Liangjie Hong, Brian D. Davison (Lehigh University)

Temporal Link Prediction by Integrating Content and Structure Information [short]
Sheng Gao, Ludovic Denoyer, Patrick Gallinari (LIP6-UPMC)

Graph Management and Queries (10:00-12:00)

Room: Barra & Jura
Chair: Raffaele Perego

High Efficiency and Quality: Large Graphs Matching
Yuanyuan Zhu, Lu Qin, Jeffrey Xu Yu, Yiping Ke (The Chinese University of Hong Kong), Xuemin Lin (University of New South Wales & NICTA)

DELTA: Indexing and Querying Multi-labeled Graphs
Jiong Yang, Shijie Zhang, Wei Jin (Case Western Reserve University)

Skynets: Searching for Minimum Trees in Graphs with Incomparable Edge Weights
Huiping Cao (New Mexico State University), K. Selcuk Candan (Arizona State University), Maria Luisa Sapino (Universita di Torino)

Fast Fully Dynamic Landmark-based Estimation of Shortest Path Distances in Very Large Graphs
Konstantin Tretyakov, Abel Armas-Cervantes, Luciano García-Bañuelos, Jaak Vilo, Marlon Dumas (University of Tartu)

CP-Index: On The Efficient Indexing of Large Graphs
Yan Xie, Philip S. Yu (University of Illinois at Chicago)

Personalization and Advertising (13:30-15:30)

Room: Argyll 1
Chair: Emine Yilmaz

Context-Aware Search Personalization with Concept Preference
Di Jiang, Kenneth Wai-Ting Leung, Wilfred Ng (The Hong Kong University of Science and Technology)

A Framework for Personalized and Collaborative Clustering of Search Results
David C Anastasiu, Byron J Gao (Texas State University-San Marcos), David Buttler (Lawrence Livermore National Laboratory)

Using Query Log and Social Tagging to Refine Queries Based on Latent Topics
Lidong Bing, Wai Lam (The Chinese University of Hong Kong), Tak-Lam Wong (The Hong Kong Institute of Education)

Retrieval Models for Audience Selection in Display Advertising [short]
Sarah K Tyler (University of California, Santa Cruz), Sandeep Pandey, Evgeniy Gabrilovich, Vanja Josifovski (Yahoo! Research)

A Language Model Approach to Capture Commercial Intent and Information Relevance for Sponsored Search [short]
Lei Wang, Mingjiang Ye (Yahoo! Global R&D Center, Beijing), Yu Zou (Yahoo! Labs)

Learning to Rank Audience for Behavioral Targeting in Display Ads [short]
Jian Tang (Peking University), Ning Liu, Jun Yan (Microsoft Research Asia), Yelong Shen (Beihan University), Shaodan Guo (Huazhong University of Science and Technology), Bin Gao (Microsoft Research Asia), Shuicheng Yan (National University of Singapore), Ming Zhang (Peking University)

Link, Graph and Relation Mining (13:30-15:30)

Room: Argyll 2
Chair: Roi Blanco

Towards Feature Selection in Network
Quanquan Gu, Jiawei Han (University of Illinois at Urbana-Champaign)

Practical Representations for Web and Social Graphs [short]
Francisco Claude (University of Waterloo), Susana Ladra (Universidade da Coruña)

Determining the Diameter of Small World Networks [short]
Frank W. Takes, Walter A. Kosters (LIACS, Leiden University)

Detecting Anomalies in Graphs with Numeric Labels [short]
Michael Davis, Weiru Liu, Paul Miller (Queen's University, Belfast), George Redpath (CEM Systems)

Extracting Multi-dimensional Relations: A Generative Model of Groups of Entities in a Corpus [short]
Ching-man Au Yeung (ASTRI), Tomoharu Iwata (NTT Communication Science Laboratories)

Distributed Social Graph Embedding [short]
Anne-Marie Kermarrec (INRIA Rennes - Bretagne Atlantique), Vincent Leroy (Yahoo! Research), Gilles Trédan (Technische Universität Berlin - Deutsche Telekom Laboratories)

Classification and Annotation in Social Corpora using Multiple Relations [short]
Yann Jacob, Ludovic Denoyer, Patrick Gallinari (University Pierre et Marie Curie)

Science, the Past, and the Future (13:30-15:30)

Room: Barra & Jura
Chair: Giorgio Orsi

Plagiarism Detection Based on Structural Information
Efstathios Stamatatos (University of the Aegean)

Studying How the Past is Remembered: Towards Computational History through Large Scale Text Mining
Ching-man Au Yeung (ASTRI), Adam Jatowt (Kyoto University)

Combining Machine Learning and Human Judgment in Author Disambiguation [short]
Yanan Qian (Xi'an Jiaotong University), Yunhua Hu (Microsoft Research Asia), Jianling Cui (Nankai University), Qinghua Zheng (Xi'an Jiaotong University), Zaiqing Nie (Microsoft Research Asia)

Citation Count Prediction: Learning to Estimate Future Citations for Literature [short]
Rui Yan (Peking University), Jie Tang (Tsinghua University), Xiaobing Liu, Dongdong Shan, Xiaoming Li (Peking University)

Extracting Cross References from Life Science Databases for Search Result Ranking [short]
Anja Bachmann, Rene Schult (Otto-von-Guericke-University), Matthias Lange (Leibniz Institute of Plant Genetics and Crop Plant Research (IPK)), Myra Spiliopoulou (Otto-von-Guericke-University)

Extracting Collective Expectations about the Future from Large Text Collections [short]
Adam Jatowt (Kyoto University), Ching-man Au Yeung (ASTRI)

Information Extraction and Entities (13:30-15:30)

Room: Shuna & Staffa
Chair: Xiaofeng Yu

Towards a Unified Solution: Data Record Region Detection and Segmentation
Lidong Bing, Wai Lam, Yuan Gu (The Chinese University of Hong Kong)

Fast Metadata-driven Multiresolution Tensor Decomposition
Claudio Schifanella (University of Torino), K. Selçuk Candan (Arizona State University), Maria Luisa Sapino (University of Torino)

Enabling Information Extraction by Inference of Regular Expressions from Sample Entities
Falk Brauer, Robert Rieger, Adrian Mocan, Wojciech M. Barczynski (SAP AG)

Mining Entity Translations from Comparable Corpora: A Holistic Graph Mapping Approach
Jinhan Kim (POSTECH), Long Jiang (Microsoft Research Asia), Seung-won Hwang (POSTECH), Young-In Song, Ming Zhou (Microsoft Research Asia)

Max Margin Learning on Domain-Independent Web Information Extraction [short]
Bin Zhao (Carnegie Mellon University), Xiaoxin Yin (Microsoft Research), Eric P. Xing (Carnegie Mellon University)

Algorithms (16:00-17:40)

Room: Argyll 1
Chair: Felix Naumann

One is Enough: Distributed Filtering for Duplicate Elimination
Georgia Koloniari, Nikos Ntarmos, Evaggelia Pitoura, Dimitris Souravlias (University of Ioannina)

Duplicate Detection Through Structure Optimization
Luís Leitão, Pável Calado (IST/INESC-ID)

SISP: A New Framework for Searching the Informative Subgraph Based on PSO
Chen Chen, Guoren Wang, Huilin Liu, Junchang Xin, Ye Yuan (Ministry of Education & Northeastern University China)

Indexes for Highly Repetitive Document Collections [short]
Francisco Claude (University of Waterloo), Antonio Fariña (University da Coruña), Miguel A. Martínez-Prieto, Gonzalo Navarro (University of Chile)

Partial Duplicate Detection for Large Book Collections [short]
Ismet Zeki Yalniz, Ethem F. Can, R. Manmatha (University of Massachusetts-Amherst)

Queries, Questions and Tags Mining (16:00-17:40)

Room: Argyll 2
Chair: Jian-Tao Sun

Finding Dimensions for Queries
Zhicheng Dou (Microsoft Research Asia), Sha Hu (Renmin University of China), Yulong Luo (Shanghai Jiaotong University), Ruihua Song, Ji-Rong Wen (Microsoft Research Asia)

Large-Scale Question Classification in cQA by Leveraging Wikipedia Semantic Knowledge
Li Cai, Guangyou Zhou, Kang Liu, Jun Zhao (Institute of Automation, Chinese Academy of Sciences)

Hierarchical Tag Visualization and Application for Tag Recommendations
Yang Song (Microsoft Research, Redmond), Baojun Qiu (Pennsylvania State University), Umer Farooq (Microsoft)

Perspective Hierarchical Dirichlet Process for User-Tagged Image Modeling [short]
Xin Chen, Xiaohua Hu, Yuan An, Zunyan Xiong (Drexel University), Tingting He (Central China Normal University), E.K. Park (California State University, Chico)

Asking What No One Has Asked Before: Using Phrase Similarities To Generate Synthetic Web Search Queries [short]
Marius Pasca (Google Inc.)

Preparing, Mining and Evaluating with and for Different Views (16:00-17:40)

Room: Barra & Jura
Chair: Hwanjo Yu

Simultaneous Joint and Conditional Modeling of Documents Tagged from Two Perspectives
Pradipto Das, Rohini Srihari, Yun Fu (SUNY Buffalo)

External Evaluation Measures for Subspace Clustering
Stephan Günnemann, Ines Färber (RWTH Aachen University), Emmanuel Müller (Karlsruhe Institute of Technology), Ira Assent (Aarhus University), Thomas Seidl (RWTH Aachen University)

Behavior-driven Clustering of Queries into Topics
Luca Maria Aiello (Università di Torino), Debora Donato, Umut Ozertem (Yahoo! Labs), Filippo Menczer (Indiana University)

Discovering Customer Intent in Real-time for Streamlining Service Desk Conversations [short]
Ullas Nambiar, Tanveer Faruquie, L Venkata Subramaniam, Sumit Negi (IBM Research - India), Ganesh Ramakrishnan (Indian Institute of Technology,)

Sparse Structured Probabilistic Projections for Factorized Latent Spaces [short]
Xinquan Qu, Xinlei Chen (Zhejiang University)

Information Extraction and Semantic Techniques (16:00-17:40)

Room: Shuna & Staffa
Chair: Marie-Aude Aufaure

Automated Feature Generation from Structured Knowledge
Weiwei Cheng (University of Marburg), Gjergji Kasneci, Thore Graepel, David Stern, Ralf Herbrich (Microsoft Research)

Filtering and Clustering Relations for Unsupervised Information Extraction in Open Domain
Wei Wang, Romaric Besançon, Olivier Ferret (CEA LIST), Brigitte Grau (LIMSI CNRS)

Facilitating Pattern Discovery for Relation Extraction with Semantic-Signature-based Clustering
Yunyao Li, Vivian Chu (IBM Research - Almaden), Sebastian Blohm (Microsoft Corporation), Huaiyu Zhu, Howard Ho (IBM Research - Almaden)

Finding All Justifications of OWL Entailments Using TMS and MapReduce
Gang Wu (Ministry of Education & Northeastern University China), Guilin Qi (Southeast University), Jianfeng Du (Guangdong University of Foreign Studies & Chinese Academy of Sciences)

Poster Session: DB posters (16:00-17:40)

Room: Castle

Scalable Entity Matching Computation with Materialization
Sanghoon Lee, Jongwuk Lee, Seung-won Hwang (Pohang University of Science and Technology (POSTECH))

Predicting the Optimal Ad-hoc Index for Reachability Queries on Graph Databases
Jintian Deng, Fei Liu, Yun Peng, Byron Choi, Jianliang Xu (Hong Kong Baptist University)

Collection-Based Compression using Discovered Long Matching Strings
Andrew Peel, Anthony Wirth, Justin Zobel (The University of Melbourne)

A Robust Index for Regular Expression Queries
Dominic Tsang, Sanjay Chawla (University of Sydney)

Integrating and Querying Web Databases and Documents
Carlos Garcia-Alvarado, Carlos Ordonez (University of Houston)

Processing the Signature Quadratic Form Distance on Many-Core GPU Architectures
Martin Kruliš, Jakub Lokoč (Charles University in Prague), Christian Beecks (RWTH Aachen University), Tomáš Skopal (Charles University in Prague), Thomas Seidl (RWTH Aachen University)

Top-k Most Influential Locations Selection
Jin Huang (South China University of Technology), Zeyi Wen, Jianzhong Qi, Rui Zhang (University of Melbourne), Jian Chen (South China University of Technology), Zhen He (La Trobe University)

Defining Isochrones in Multimodal Spatial Networks
Johann Gamper (Free University of Bolzano-Bozen), Michael Böhlen (University of Zurich), Willi Cometti, Markus Innerebner (Free University of Bolzano-Bozen)

On the Elasticity of NoSQL Databases over Cloud Management Platforms
Ioannis Konstantinou, Evangelos Angelou, Christina Boumpouka, Dimitrios Tsoumakos, Nectarios Koziris (National Technical University of Athens)

Continuous Data Stream Query in the Cloud
Jun Li (Beijing University of Posts and Telecommunications), Peng Zhang, Jianlong Tan, Ping Liu, Li Guo (Chinese Academy of Sciences)

A Cluster based Mobile Peer to Peer Architecture in Wireless Ad Hoc Networks
He Li, KyoungSoo Bok, JaeSoo Yoo (Chungbuk National University)

Block-based Load Balancing for Entity Resolution with MapReduce
Lars Kolb, Andreas Thor, Erhard Rahm (University of Leipzig)

PCMLogging: Reducing Transaction Logging Overhead with PCM
Shen Gao, Jianliang Xu (Hong Kong Baptist University), Bingsheng He (Nanyang Technological University), Byron Choi, Haibo Hu (Hong Kong Baptist University)

A Continuous Query Evaluation Scheme for a Detection-Only Query over Data Streams
Hong Kyu Park, Won Suk Lee (Yonsei University)

Subject-oriented Top-k Hot Region Queries in SpatialDataset
Junling Liu (Northeastern University, Shenyang Jianzhu University), Ge Yu (Northeastern University), Huanliang Sun (Shenyang Jianzhu University)

k-Nearest Neighbor Query Processing Method Based on Distance Relation Pattern
Yonghun Park (Chungbuk National University), Dongmin Seo (Korea Institute of Science and Technology Information), Kyoungsoo Bok, Jaesoo Yoo (Chungbuk National University)

Efficient Query Rewrite for Structured Web Queries
Sreenivas Gollapudi, Samuel Ieong (Microsoft Research), Alexandros Ntoulas (Zynga), Stelios Paparizos (Microsoft Research)

Rule-based Construction of Matching Processes
Eric Peukert (SAP Research, SAP AG), Julian Eberius (Dresden University of Technology), Erhard Rahm (University of Leipzig)

A Taxonomy of Local Search: Semi-Supervised Query Classification Driven by Information Needs
Jiang Bian, Yi Chang (Yahoo! Labs)

ONTOCUBE: Efficient Ontology Extraction using OLAP Cubes
Carlos Garcia-Alvarado, Zhibo Chen, Carlos Ordonez (University of Houston)

An Algorithm for Axiom Pinpointing in EL+ and its Incremental Variant
Xiaojun Cheng, Guilin Qi (Southeast University)

Folksonomy-Based Term Extraction for Word Cloud Generation
David Carmel, Erel Uziel, Ido Guy, Yosi Mass, Haggai Roitman (IBM Research, Haifa lab)

Efficient Association Discovery with Keyword-based Constraints on Large Graph Data
Mo Zhou, Yifan Pan, Yuqing Wu (Indiana University)

AWETO: Efficient Incremental Update and Querying in RDF Storage System
Xu Pu, Jianyong Wang (Tsinghua University), Ping Luo, Min Wang (HP Labs China)

Insert-friendly XML Containment Labeling Scheme
Canwei Zhuang, Ziyu Lin, Shaorong Feng (Xiamen University)

A Pretopological Framework for the Automatic Construction of Lexical-Semantic Structures from Texts
Guillaume Cleuziou, Davide Buscaldi, Vincent Levorato (University of Orléans), Gaël Dias (Universidade da Beira Interior)

Leveraging Web 2.0 Data for Scalable Semi-supervised Learning of Domain-specific Sentiment Lexicons
Raymond Yiu Keung Lau, Chun Lam Lai (City University of Hong Kong), Peter B. Bruza (Queensland University of Technology), Kam F. Wong (Chinese University of Hong Kong)

Classifying Trending Topics: A Typology of Conversation Triggers on Twitter
Arkaitz Zubiaga, Damiano Spina, Víctor Fresno, Raquel Martínez (UNED)

Enhancing Accessibility of Microblogging Messages Using Semantic Knowledge
Xia Hu (Arizona State University), Lei Tang (Yahoo! Labs), Huan Liu (Arizona State University)

Imbalanced Sentiment Classification
Shoushan Li, Guodong Zhou, Zhongqing Wang (Soochow University), Sophia Yat Mei Lee (Hong Kong Baptist University), Rangyang Wang (Soochow University)

The Where in the Tweet
Wen Li (Delft University of Technology), Pavel Serdyukov (Yandex LLC), Arjen P. de Vries (CWI), Carsten Eickhoff, Martha Larson (Delft University of Technology)

Question Identification on Twitter
Baichuan Li (The Chinese University of Hong Kong), Xiance Si (Google), Michael R. Lyu, Irwin King (The Chinese University of Hong Kong), Edward Y. Chang (Google)

OpinioNetIt: Understanding the Opinions-People Network for Politically Controversial Topics
Rawia Awadallah (Max-Planck Institute for Informatics), Maya Ramanath (Indian Institute of Technology, Delhi), Gerhard Weikum (Max-Planck Institute for Informatics)

Predicting the Uncertainty of Sentiment Adjectives in Indirect Answers
Mitra Mohtarami, Hadi Amiri (National University of Singapore), Man Lan (Institute for Infocomm Research), Chew Lim Tan (National University of Singapore)

Sentiment Classification via L2-norm Deep Belief Network
Tao Liu (Renmin University of China), Minghui Li (Microsoft Asian Research and Development Group), Shusen Zhou (Harbin Institute of Technology), Xiaoyong Du (Renmin University of China)

Domain Customization for Aspect-oriented Opinion Analysis with Multi-level Latent Sentiment Clues
Honglei Guo, Huijia Zhu, Zhili Guo, Zhong Su (IBM Research China)

Accurate Information Extraction for Quantitative Financial Events
Hassan H Malik, Vikas S Bhardwaj, Huascar Fiorletta (Thomson Reuters)

A Machine-Learned Proactive Moderation System for Auction Fraud Detection
Liang Zhang, Jie Yang (Yahoo! Labs), Wei Chu (Microsoft), Belle Tseng (Yahoo! Labs)

Simultaneously Improving CSAT and Profit in a Retail Banking Organization
Sameep Mehta, Ullas Nambiar, Vishal Batra, Sumit Negi, Prasad Deshpande, Gyana Praija (IBM Research India)

Coarse-to-Fine Classification via Parametric and Nonparametric Models for Computer-Aided Diagnosis
Le Lu (Siemens Medical Solutions USA), Meizhu Liu, Xiaojing Ye (University of Florida), Shipeng Yu (Siemens Medical Solutions USA), Heng Huang (University of Texas, Arlington)

Demo Session: Demo Boasters 3

MEMSCALE: In-Cluster-Memory Databases
Héctor Montaner, Federico Silla (Universitat Politècnica de València), Holger Fröning (University of Heidelberg), José Duato (Universitat Politècnica de València)

H-DB: A Hybrid Quantitative-Structural SQL Optimizer
Lucantonio Ghionna, Gianluigi Greco, Francesco Scarcello (University of Calabria)

Health Conversational System based on Contextual Matching of Community-Driven Question-Answer Pairs
Wilson Wong, John Thangarajah, Lin Padgham (RMIT University)

Annotating Knowledge Work Lifelog: Term Extraction from Sensor and Operation History
Masayuki Okamoto, Nayuko Watanabe, Shinichi Nagano, Kenta Cho (Toshiba Corporation)

Entity Timelines: Visual Analytics and Named Entity Evolution
Arturas Mazeika, Tomasz Tylenda, Gerhard Weikum (Max Planck Institute for Informatics)

PICASSO - Automated Soundtrack Suggestion for Multi-Modal Data
Aleksandar Stupar, Sebastian Michel (Saarland University)

P2Prec: A Social-Based P2P Recommendation System
Fady Draidi, Esther Pacitti (LIRMM), Didier Parigot, Guillaume Verger (INRIA)

Sponsors: