|
Linguateca
Summer School
Syntax
Module
Constraint
Grammar exercises
For the
CG exercise section, we will use VISL's CG lab, at
https://edu.visl.dk/cglab.htm
, linked from the general CG page at
https://edu.visl.dk/constraint_grammar.html
.
Suggested
reading: For doing the actual exercises, you don't have to be a
Constraint Grammar expert, The Summer School syntax module should
have provided you with some basics about the CG formalism as such,
and the Vislcg/CG-2 grammar formalism in particular. Hopefully you'll
also have a rough idea, from the Corpus module, about the categories
used in the Portuguese PALAVRAS parser. If you need help while doing
the exercises, you can always check the details in the following
references:
Vislcg
formalism: https://edu.visl.dk/cg2_howto.html
Grammatical
categories: https://edu.visl.dk/pt/info/symbolset-manual.html
For the
exercises, we suggest that you copy the example grammar file
(https://edu.visl.dk/cg_template)
to your computer, and use it as a point of departure to add your own
rules. You can then make changes and upload the changed versions for
use with CG lab. Alternatively, you can copy & paste the grammar
into CG lab's grammar field, and change it there.
1. Inspection
For a
start, run the example grammar as-is, with
the following example sentence, and try to understand which rule does
what. In the parser menu, use first 'tagger' and then 'morphological
analyzer'. The latter will give your grammar ambiguous morphological
input, while 'tagger' will give it disambiguated input.
Isto é uma prova.
Se
for provado que o piloto deixou deliberadamente o avião cair
no mar, a companhia e talvez seus herdeiros deveriam pagar milhões
de dólares em indenização.
2. Noun phrases
Next, try to make a little
grammar for noun phrases, with the examples from the ambiguity
exercise as a point of departure, using 'morphological analyzer'. The
idea is to disambiguate part of speech by looking at the immediate
np-context. E.g.:
SELECT
(N) (-1 (<artd>)) (1 (<KOMP>)) (2 (ADJ) OR (PCP)) ;
A
entrada mais cara custava 300 escudos.
Resolveu
então telefonar a mais amigos.
Tendo-a
visto mais alegre, ficaram todos menos preocupados.
O
resultado menos positivo não foi o seu.
Mesmo
os ouvintes menos atentos prestaram atenção.
3. Place & Time semantic roles
Finally,
using the full syntactic parser ('Standard Parser') as input, try to
add semantic roles for place and time to prepositions (in effect,
marking the whole pp). Since at this level of analysis, parses
already contain @tags (for syntax), you have to use a different
prefix, the VISL convention being '%' for semantic roles. Try some of
the following semantic roles:
%TOP-PL
= place/topological ... no Brasil
%TOP-GL
= goal/direction .... para o Brasil, ao Brasil
%TOP-SRC
= source ... do Brasil
%TEMP-PL
= point/period in time ... em 1999, antes de 1999, entre domingo e
terça-feira
%TEMP-GL
= time/temporal goal ... "até 1999!
%TEMP-SRC
= time/temporal source ..."de 1999, a partir de ..."
%TEMP-DUR
= durative ... "durante ..."
For a start, simply
write MAP rules into the grammar window - CG lab will automatically
add the DELIMITER, SETS and MAPPING lines. You can exploit the fact,
that time/place preposition should already be marked as @<ADVL,
@ADVL>, @<ADVS, @<ADVO etc. by the syntactic parser. The
following rule, for instance, will mark the preposition 'em' for
place-hood, given a few set definitions:
LIST
N/PROP-LOC = <top> <civ> <inst> <L> <Lh>
<Lciv> <Lwater> <Lpath> <build> <BB> ;
LIST
@ADVL = @<ADVL @ADVL> @<ADVS @ADVS> @<ADVO @ADVO> ;
MAP
(%TOP-PL) TARGET ("em" PRP) IF (0 @ADVL) (*1 (@P<) LINK 0
N/PROP-LOC) ;
An
example of a time rule:
MAP
(%TEMP-PL) TARGET ("em" PRP) IF (0 @ADVL) (*1 @P< LINK 0
NUM) ;
The
following sentences are from the Público corpus. All contain
at least the preposition 'em', but you are of course welcome to mark
other prepositions, too.
É
uma das mais antigas discotecas do Algarve, situada em Albufeira,
que continua a manter os traços decorativos e as clientelas
de sempre .
O
Audioman foi desenvolvido na Suíça em apenas sete
meses e compõe-se de um microfone e de um altifalante que se
podem acoplar facilmente a um computador, devendo ser comercializado
ao preço de 290 francos suíços (28 contos) .
Junqueiro
recordou ainda que, nas últimas autárquicas, o IGAT
suspendeu as suas actividades um mês antes das eleições
.
O
museu, a desenvolver sob orientação de uma comissão
de notáveis, dirigida pelo Presidente da República,
está orçado em seis milhões de contos, valor
incomportável para a Força Aérea .
A
aumentar a confusão geral nos meios jornalísticos,
chegou entretanto às redacções um outro fax,
este assinado pelo deputado Pacheco Pereira, em que se afirma:
Mas
é-o apenas porque este Governo e esta maioria, escolheram,
desde Agosto do ano passado, a imigração e a política
da imigração como ponto de clivagem política
para as próximas legislativas, ontem mesmo marcadas para
Março de 1998, em simultâneo com as regionais .
A
FIDE, que organiza a competição desde 1948, declarou
estar pronta para defender os seus direitos em tribunal, e acusou
Kasparov e Short de privilegiarem os seus interesses económicos
ao tentarem conseguir uma verba superior à oferecida pela
cidade de Manchester para organizar a final e que rondava os 250 mil
contos .
Henrique
Calisto porque o terreno estava quase impraticável, o Leixões
defendera o adiamento da partida antes do seu início e tinha
menos um homem em campo que o adversário, por expulsão
de Sérgio .
Quanto
ao jogo, ele dividiu-se em dois períodos distintos: antes e
depois da expulsão de Sérgio .
O
russo será uma das seis línguas principais usadas por
João Paulo II amanhã e depois, no Encontro Mundial da
Juventude, no Santuário Mariano de Czestokowa, onde se prevê
a presença de um milhão de jovens, o dobro dos que há
dois anos se congregaram em Santiago de Compostela .
Mas
convencionou-se que esta sua deslocação de três
dias, para presidir ao Encontro dos Jovens em Czestochawa, seria
considerado um complemento ainda da sua recente viagem à
Polónia, de 1 a 9 de Junho passado .
O
caso ocorreu numa noite de 1978, na ilha de Carvalo, ao largo da
Córsega .
O
príncipe jantava com amigos num restaurante deste paraíso
para milionários, quando um grupo barulhento de jovens da
alta sociedade italiana acostou na enseada de Palma, ao lado do seu
iate, o L'Aniram .
Naquele
ano, as Brigadas Vermelhas (BR) estavam no auge da actividade
terrorista, o líder cristão-democrata Aldo Moro
acabara de ser raptado, e o príncipe -- proibido de entrar em
Itália desde o exílio do pai em 1946 -- teria mesmo
recebido ameaças das BR .
|
|